thon 


从 入 门 到 精通 目 


A 
人 生 苦 短 ， 我 用 Python 


零 基 础 起 步 ， 手 把 手 进 阶 ， 辅 以 实际 案例 ， 
Python 这 样 学 才 简 单 ! 


5 二 、 
四 
E> 


贺 中 国 工 信 由 版 信 团 ” 国 筷 到 


和 版 权 信息 
书 名 : 跟 老 齐 学 Python: 从 入 门 到 精通 
作者 : 齐 伟 
出 版 社 : 电子 工业 出 版 社 
ISBN: 978-7-121-28034-4 
定价 : 69.00 
版 权 所 有 :侵权 必 究 


用 吾 


这 征 一 本 学 习 材 料 ， 有 是 为 编程 < 零 基础 ”的 朋友 学 习 Python 近 供 的 类 似 
教材 的 学 习 材 料 ， 所 以 ， 内 容 会 有 庞杂 琐碎 之 感 ， 但 这 对 于 “ 零 基 
ee 。 所以， 不 要 把 这 本 书 当 作 *“ 开 发 手册 "来 


本 书 虽 然 是 以 “ 零 基础 ”起步 ， 但 是 并 不 打算 仪 仅 涉 及 一 些 浅 显 的 入 门 
知识 ， 当 然 基础 知识 是 必 不 可 少 的 ， 还 想 为 “ 零 基 础 "的 朋友 多 提供 一 
些 知识 ,一些 所 请 高 级 的 内 容 ， 既 满足 了 好 奇 心 ， 也 可 以 顺势 深入 人 研 
完 。 当 然 ， 真 正 的 深入 还 需要 读者 目 己 努力 。 


“ 敬 情 上帝 是 智慧 的 开端 ”。 在 本 书 的 编写 过 程 中 ， 一 直 悍 恐 于 能 否 所 
言 无 误 ， 但 水 平 有 限 ， 错误 难免 艇 请 读者 指出 ， 并 特别 建议 ， 对 有 
异议 的 地 方 ， 请 使 用 Google 网 站 搜索 更 多 的 站 务 料 进行 比较 阅读 ， 也 可 
以 跟 我 联系 ， 共 同 探讨 。 为 了 便于 进行 技术 交流 ， 我 创建 了 一 个 QQ 和 群 
( 群 号 : 26913719) ， 专 供 本 书 读者 研讨 技术 问题 。 


完成 本 书 征 一 个 比较 漫长 的 过 程 ， 在 这 个 过 程 中 ， 得 到 了 很 多 朋友 的 
帮助 ， 在 这 里 对 他 们 表示 感谢 ， 并 将 他 们 的 名 号 列 在 下 面 : 


李 航 、 令 狐 虫 、github641、dongm2ez、wdyggh、codexc、Wwinecat、 
solarhell、ArtinHuang、 匡 优 。 


在 本 书 编辑 过 程 中 ， 电 子 工 业 出 版 社 的 编辑 高 洪 霞 、 黄 爱 萍 为 本 书 的 
面世 做 出 了 极 大 的 努力 ， 对 她 们 的 工作 表示 诚 敬 感谢 。 


最 后 ， 要 感谢 我 的 麦子， 在 本 书 的 写作 过 程 中 ， 她 给 了 我 很 多 鼓励 ， 
还 协助 我 检查 文本 内 容 。 


希望 这 本 书 能 够 为 有 意 学 习 Python 的 读者 提供 帮助 。 


齐 伟 
2016 年 1 月 


第 1 季 ”基础 


从 这 里 开始 ， 请 读者 一 一 你 已 经 确信 和 目 己 是 要 学 习 Python 的 准 程 序 员 
了 一 -一 跟 我 一 起 ， 领 略 一 番 Python 的 基础 知识 ， 这 是 学 好 Python 的 起 
步 ， 同 时 ， 其 内 容 也 和 其 他 的 高 级 编程 语言 有 相通 之 处 。 所 以 ， 学 习 
Python 是 一 种 “性 价 比 ?非常 高 的 事情 。 


在 本 季 中 ， 要 加 读者 介绍 Python 的 基本 对 象 类 型 、 语 法 规则 和 函数 的 
相关 知识 。 学 习 完 这 些 内 容 ， 束 能 够 用 Python 做 很 多 事情 了 ， 且 在 其 
中 还 会 不 断 强 化 一 种 掌握 Python 的 方法 。 


第 0 和 章 预备 


从 现在 开始 ， 本 书 将 带领 你 一 零 基础 的 学 习 者 一 一 进入 到 Python 世 
界 。 进 入 这 个 世界 ， 你 不 仅 能 够 体会 到 Python 的 魅力 ， 感 受到 编程 的 
快乐 ， 还 顺便 可 以 成 为 一 个 程序 员 ， 我 相信 你 一 定 能 成 为 一 个 伟大 的 
程序 员 ， 当 然 这 并 不 是 本 书 的 目的 ， 更 不 是 本 书 的 功劳 。 当 你 成 为 一 
个 技术 大 牛 的 时 候 ， 最 应 该 感谢 的 是 你 的 父母 ， 如 果 你 顺便 也 感谢 一 
0 
坡 个 尺 。 


预备 ，Let’s go ! 


0.1 天 于 Python 的 故事 


学 习 一 种 编程 语言 是 一 件 很 有 意思 的 事情 ， 从 现在 开始 ， 我 束 和 你 一 
起 来 学 习 一 种 叫 作 Python 的 编程 语言 。 


在 编程 界 ， 存 在 着 很 多 某 种 语言 的 忠实 跟随 者 ， 因 为 忠实 ， 就 会 如 同 
卫 道 十 一 样 有 了 维护 那 种 语言 采 誉 的 义务 ， 所 以 尽 见 到 有 人 争论 哪 种 
语言 好 、 哪 种 语言 不 好 。 当然， 好 与 坏 的 标准 是 不 一 样 的 ， 有 些 人 以 
学 了 之 后 能 不 能 挣 大 钱 为 标准 ， 有 些 人 以 是 否 容 易学 为 标准 ， 或 许 还 
有 人 以 能 不 能 将 来 和 妹子 一 同 工 作 为 标准 (也 或 许 没有 ) ， 甚 至 有 些 
人 束 没 有 什么 标准 ， 只 十 质感 沉 或 者 道听途说 而 人 云 亦 云 于 了 。 


读者 在 本 书 中 将 看 到 一 个 磊 为 迷恋 于 Python 的 人 ， 因 为 全 书 看 不 到 一 
0 


不 管 是 语言 还 是 其 他 什么 ， 挑 缺点 是 比较 容易 的 事情 ， 但 找 优点 都 是 
困难 的 ， 所 以 ，《 圣 经 》 中 那 句 话 一 一 为 什么 你 看 见 弟 兄 的 眼中 有 
刺 ， 却 不 想 目 己 眼 中 有 梁 木 呢 ? 一 一 是 值得 我 们 牢记 的 。 


在 本 书 开 始 就 废话 连篇 ， 显 见 本 书 不 会 有 什么 “干货 *"， 倒 是 “水 货 * 顾 
多 ， 并 不 是 因为 “水 是 生命 的 源 录 ”， 而 是 因为 作者 水 平 有 限 ， 如 采 不 
挨 “ 水 ”， 唯 恐 说 不 清道 不 明 ， 还 敬 请 读者 谅解 。 嫌 “水 ”多 的 ， 就 此 可 
以 合 上 本 书 去 看 网 上 的 各 种 电影 吧 。 也 不 用 在 网 上 喷 我 ， 因 为 那样 只 
能 增加 更 多 的 “口水 ”( 还 是 水 ) 。 

下 面 说 扩 儿 正经 的 。 

0.1.1 Python 的 昨天 、 今 天 和 明天 

这 个 题目 有 点 大 了 ， 似 乎 回顾 过 去 、 考 察 现在 、 张 望 未 来 都 是 那些 掌 
握 方 癌 的 大 人 物 做 的 。 那 融 让 我 们 每 个 人 都 成 为 大 人 物 吧 。 因 为 如 宁 
不 回顾 一 下 历史 ， 似 乎 无 法 满足 好 奇 心 ， 如 采 不 考察 一 下 现在 ， 也 不 
放心 (担心 学 了 之 后 没有 什么 用 途 ) ; 如 果 不 张望 一 下 未 来 ， 怎 么 能 
吸引 (也 算是 一 种 忽悠 吧 ) 你 呢 ? 


1.Python 的 历史 


历史 回来 是 成 功 者 的 传记 ， 现 在 流传 的 天 于 Python 的 历史 也 是 如 此 。 


Python 的 创始 人 为 吉 多 : 范 罗 苏 姆 (Guido van Rossum) ， 关 于 他 开发 
Python 的 过 程 ， 很 多 资料 里 面 都 要 记录 下 面 的 故事 : 


1989 年 的 圣诞 节 期 间 ， 吉 多 . 范 罗 区 姆 为 了 在 阿姆斯特丹 打发 时 间 ， 决 
心 开发 一 个 新 的 脚本 解释 程序 ， 作 为 ABC 语言 的 一 种 继承 。 之 所 以 选 
中 Python 作 为 程序 的 名 字 ， 是 因为 他 是 一 个 蒙 提 : 派 森 的 飞行 马戏 团 的 
爱好 者 。ABC 是 由 吉 多 参加 设计 的 一 种 教学 语言 ， 在 吉 多 本 人 看 来 ， 
ABC 这 种 语言 非常 优美 和 强大 ， 是 专门 为 非 专业 程序 员 设 计 的 。 但 是 
ABC 语 言 并 没有 成 功 ， 究 其 原因 ， 吉 多 认为 是 非 开放 造成 的 。 吉 多 决 
人 并 取得 了 非常 好 的 效果 ， 完 美 结 合 了 C 和 
其 仙 一 二 后 豆 ° 


这 个 故事 是 从 维基 百科 里 面 直接 复制 过 来 的 ， 很 多 讲 Python 历 史 的 资 


料 里 面 ， 也 都 转载 了 这 一 段 文 字 。 但 是 ， 在 我 来 看 ， 天 多 是 为 了 “打发 
时 间 * 而 决定 开发 Python， 源 自 他 的 这 样 一 段 自述 : 


Over six years ago, in December 1989, I was looking for 
a"hobby"programming project that would keep me occupied during the 
week around Christmas.My office (a government-run research lab in 
Amsterdam) would be closed, but I had a home computer, and not much 
else on my hands.I decided to write an interpreter for the new scripting 
language I had been thinking about lately:a descendant of ABC that would 
appeal to Unix/C hackers.I chose Python as a working title for the project, 
being in a slightly irreverent mood (and abig fan of Monty Python's 
Flying Circus) . (原文 地 址 : 
https://www.python.org/doc/essays/foreword/) 


- 必须 承认 ， 这 个 哥们 儿 是 一 个 非常 牛 的 人 ， 此 处 献上 茶 敬 的 案 


其 次 ， 刚 刚 开 始 学 习 Python 的 朋友 ， 可 千 万 别 认为 Python 是 一 个 可 以 
随 随 便便 鼓 揭 的 东西 ， 人 家 也 是 站 在 巨人 的 肩膀 上 的 。 


第 三 ， 牛 人 在 成 功 之 后 ， 往 往 把 奋斗 的 过 程 描绘 得 比较 簿 单 。 或 者 是 
出 于 谦虚 ， 或 者 是 为 了 让 人 听 起 来 他 更 牛 。 反 正 ， 我 们 看 最 后 结 采 的 
时 候 ， 很 难 感受 过 程 中 的 酸 垂 百 略 。 


不 管 坚 样 ， 吉 多 : 苑 罗 苏 姆 在 那 时 刻 创 并 了 Python， 而 且 ， 更 牛 的 在 于 
他 具有 现代 化 的 思维 一 一 开放 ， 并 通过 Python 社区 ， 吸 引 来 目 世界 各 

地 的 开发 者 ， 参 与 Python 的 建设 。 在 这 里 ， 请 读者 一 定 要 联想 到 Linux 
和 息 的 创始 人 林 纳 斯 : 托 瓦 效 。 两 者 都 乘 承 “开放 ?思想 ， 得 到 了 来 目 世 
界 各 地 开发 者 和 应 用 者 的 欢呼 和 尊敬 。 

请 读者 向 所 有 倡导 “开放 ”的 咎 人 们 表示 敬意 ， 古 他 们 让 这 个 世界 变 得 

更 类 好， 他们 以 行动 诠释 了 热力 学 第 二 定律 一 一 “ 烂 增 原理 ”。 


2.Python 的 现在 


Python 现在 越 来 越 火 了 ， 因 为 它 搭 上 了 “大 数据 ”`\“ 云 计算 ”`\“ 目 然 语 
言 处 理 ? 等 这 些 时 蓝 名 词 的 便 车 。 

网 上 时 常会 有 一 些 编程 语言 排行 榜 之 类 的 东西 ， 有 的 初学 者 常常 修 排 
行 榜 所 迷惑 ， 总 想 要 学 习 排 列 在 第 一 位 的 ， 认 为 排 在 第 一 位 的 编程 语 
言 需求 量 大 。 不 管 排行 榜 是 怎么 编制 的 ，Python 虽 然 没 有 登 上 状元 、 
榜眼 、 探 伦 之 位 ， 但 也 不 太 靠 后 呀 。 

另外 一 个 信息 ， 更 能 激动 一 下 初学 者 那 颗 脆弱 的 小 心脏 。 


Dice.com 了 网 上 对 20000 名 IT 专业 人 士 进行 调查 的 结果 显示 : Java 类 程序 
员 平 均 工 资 91060 美 元 ，Python 类 程序 员 平 均 工 资 90208 美 元 。 


Python 程 序 员 比 Java 程 序 员 的 平均 工资 低 ， 但 看 看 差距 ， 再 看 看 两 者 
的 学 习 难 度 ， 学 习 Python 绝 对 是 一 个 性 价 比 非常 高 的 投资 。 


这 人 么 合算 的 编程 语言 不 学 等 符 何 时 ? 
3.Python 的 未 来 


Python 的 未 来 要 靠 读 者 了 ， 你 学 好 了 、 用 好 了 ， 未 来 它 束 光明 了 ， 它 
的 未 来 在 你 手 里 。 如 图 0-1 所 示 为 Python 创 始 人 人 吉 多 : 范 罗 苏 姆 。 


0.1.2 ”Python 的 特点 


很 多 高 级 语言 都 宣称 目 己 是 简单 的 、 入 门 容易 的 ， 并 且 具 有 普 适 性 ， 
但 真正 能 做 到 这 些 的 ， 只 有 Python。 有 朋友 做 了 一 件 讨 衫 ， 上 面 写 


着 “生命 有 限 ， 我 用 Python”， 这 说 明 什 么 ? 说 明 Python 有 着 简单 、 开 

发 速度 快 、 和 省 时 间 和 精力 的 特点 。 因 为 它 是 开放 的 ， 有 很 多 可 爱 的 
开发 者 (为 开放 社区 做 贡献 的 开发 者 是 最 可 爱 的 人 ) ， 将 常用 的 功能 
| 谁 都 可 以 拿 过 来 使 用 。 这 就 是 Python， 这 就 是 开 

万 o 


图 


0-1 Python 创始 人 : 


吉 多 : 范 罗 苏 姆 


茶 敬 地 抄录 来 自 《 维 基 百 科 》 的 搬 述 : 


Python 是 完全 面 癌 对 象 的 语言 ， 函 数 、 模 块 、 数 字 、 字 符 串 都 是 对 
象 ， 并 且 完 全 支持 继承 、 重 载 、 派 生 、 多 继承 ， 有 益 于 增强 源 代 码 的 
复 用 性 。Python 文 持 重 载 运算 符 ， 因 此 也 文 持 泛 型 设计 。 相 对 于 Lisp 
这 种 传统 的 函数 式 编程 语言 ，Python 对 函数 式 设计 只 提供 了 有 限 的 支 
持 。 有 两 个 标准 库 (functools 和 itertools) 提供 了 Haskell 和 Standard ML 
中 久 经 考验 的 函数 式 程序 设计 工具 。 


虽然 Python 可 能 被 粗略 地 分 类 为 “脚本 语言 ” (Script Language) ， 但 实 
际 上 一 些 大 规模 软件 开发 项 目 (例如 Zope、Mnet、BitTorrent 及 
Google) 也 都 广泛 地 使 用 它 。Python 的 文 持 者 较 喜 欢 称 它 为 一 种 高 级 
动态 编程 语言 ， 原 因 是 “脚本 语言 " 汉 指 仅 做 简单 程序 设计 任务 的 语 
言 ， 如 shell script、VBScript 等 ， 但 其 只 能 处 理 简 单 任务 的 编程 语言 ， 
并 不 能 与 Python 相提并论 。 


Python 本 吴 被 设计 为 可 扩充 的 ， 并 非 所 有 的 特性 和 功能 都 集成 到 语言 
核心 。Python 提 供 了 丰富 的 API 和 工具 ， 以 便 程 序 员 能 够 轻松 地 使 用 
C、C++、Cython 来 编写 扩充 模块 。Python 编 译 絮 本 身 也 可 以 被 集成 到 
其 他 需要 脚本 语言 的 程序 内 。 因 此 ， 很 多 人 还 把 Python 作为 一 种 “胶水 
语言 ” (glue language) 使 用 ， 使 用 Python 将 其 他 语言 编写 的 程序 进行 
集成 和 封装 。 在 Google 内 部 的 很 多 项 目 ， 例 如 Google Engine 使 用 

C++ 编写 性 能 要 求 极 高 的 部 分 ， 然 后 用 Python 或 Java/Go 调 用 相应 的 模 
块 。《Python 技 术 手 册 》 的 作者 马 特 利 (Alex Martelli) 说 : “2004 
年 ，Python 已 在 Google 内 部 使 用 ，Google 招 募 许 多 Python 高 手 ， 但 在 
这 之 前 就 已 决定 使 用 Python。 他 们 的 目的 是 尽量 使 用 Python， 在 不 得 
已 时 改 用 C++; 在 操控 硬件 的 场合 使 用 C++， 在 快速 开发 时 使 用 
Python。?” 


可 能 这 里 面 有 一 些 术语 还 不 是 很 理解 ， 没 关系 ， 只 要 明日 : Python 是 
一 种 很 牛 的 语言 ， 应 用 人 简单， 功能 强大 ，Google 都 在 使 用 ， 这 就 足够 
了 了 ， 足 够 让 你 下 决心 学 习 了 。 

0.1.3 ”Python 哲学 


Python 之 所 以 与 众 不 同 ， 还 在 于 它 强 调 一 种 哲学 理念 ， 优 雅 、 明 确 、 
1 。 有 一 段 诗歌 读 起 来 似乎 很 立 ， 但 真实 反映 了 Python 开 发 者 的 开 
理念 : 


The Zen of Python 


Beautiful is better than ugly. 

Explicit is better than implicit. 

Simple is better than complex. 

Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 

Special cases aren't special enough to break the rules. 

Although practicality beats purity. 

Errors should never pass silently. 

Unless explicitly silenced. 

In the face of ambiguity, refuse the temptation to guess. 

There should be one-- and preferably only one --obvious way to do it. 
Although that way may not be obvious at first unless you're Dutch. 
Now is better than never. 

Although never is often better than “right” now. 


If the implementation is hard to explain, it's a bad idea. 


If the implementation is easy to explain, it may be a good idea. 


网 上 能 够 看 到 这 上段 文字 的 中 文 译本 ， 读 者 可 以 去 搜索 阅读 
0.2 ”从 小 工 到 专家 


这 个 标题 ， 我 借用 了 一 本 书 的 名 字 一 《程序 员 修炼 之 道 ， 从 小 工 到 
专家 》， 并 在 此 特别 推荐 阅读 。 


“从 小 工 到 专家 ”也 是 很 多 刚 学 习 编程 的 朋友 的 愿望 。 如 何 能 实现 呢 ? 
《程序 员 修 炼 之 道 ， 从 小 工 到 专家 》 这 本 书 中 ， 给 出 了 非常 好 的 建 


议 ,值得 借鉴 。 


有 一 个 学 习 python 的 朋友 曾 问 我 :“ 书 已 经 看 了 ， 书 上 的 代码 也 运行 过 
了 ， 习 题 也 能 解答 了 ， 但 是 还 不 知 如 何 开 发 一 个 真正 的 应 用 程序 ， 不 
知 从 何 处 下 手 ， 怎 么 办 ? 


另外 ， 也 遇 到 过 一 些 刚刚 毕业 的 大 学 生 ， 从 简历 上 看 ， 相 关 专 业 的 考 
试 分数 是 不 错 的 (我 一 般 相 信和 那些 成 绩 是 真 的 ，， 但 是 ， 一 讨论 到 专 
业 问 题 ， 和 党 党 不知 所 云 ， 特 别 是 当 让 他 面 对 真 实 的 工作 对 象 时 ， 表 现 
出 来 的 比 成 绩 单 差 太 多 了 。 


O 


对 于 上 述 情况 ， 我 一 般 会 武断 地 下 一 个 结论 : 练 得 少 。 


要 从 小 工 成 长 为 专家 ， 必 经 之 路 是 要 多 阅读 代码 ， 多 调试 程序 。 古 
言 “ 拳 不 离 手 ， 曲 不 离 口 "， 多 练习 是 成 为 专家 的 唯一 途径 。 


0.2.1 零 基 础 


有 一 些 初学 者 ， 特 别 是 非 计算 机 专业 的 人 ， 担 心目 己基 础 差 ， 不 能 学 
好 Python。 诚 然 ， 在 计算 机 方面 的 基础 越 好 ， 对 学 习 任 何 一 门 新 的 编 
程 语言 越 有 利 。 但 如 果 是 “绝对 零 基础 "也 不 用 担心 ， 本 书 就 是 从 这 个 
角度 切入 来 满足 你 的 需要 的 。 几 事 总 得 有 一 个 开始 ， 那 么 束 让 本 书 成 
为 你 学 习 编 程 语言 的 开始 吧 。 


就 我 个 人 来 看 ，Python 坪 比较 适合 作为 学 习 编程 的 入 门 语 言 的 。 
美国 有 不 少 高 校 也 这 么 认为 ， 他 们 纷纷 用 Python 作为 编程 专业 甚至 是 


如 图 0-2 所 示 为 美国 各 高 校 设立 的 编程 
后 吕 巡 业 。° 


Number of top 39 U.S. computer science departments 
that use each language to teach introductory courses 


5 
0 四 i ll 


Python Java MATLAB C++ C Scheme Scratch 


Analysis done by Philip Guo (www.pgbovine .net) in july 2014 


图 0-2 美国 高 校 设立 的 编程 语言 专业 


总 而 言 之 ， 学 习 Python， 你 不 用 担心 基础 问题 。 


0.2.2 ”阅读 代码 


有 句 话说 得 好 : “读书 破 万 卷 ， 下 笔 如 有 神 "， 这 也 适用 于 编程 。 通 过 
阅读 别人 的 代码 ,“ 站 在 巨人 的 肩膀 上 ”， 让 自己 眼界 开阔 ， 思 维 充 
妆 O 


阅读 代码 的 最 好 地 方丈 是 :www.github.com 。 


如 果 你 还 没有 账号 ， 请 尽快 注册 ， 它 将 是 你 成 为 一 个 优秀 程序 员 的 起 
点 。 当 然 ,， 不 要 起 记 来 follow 我 ， 我 的 账号 是 : qiwsir 。 


阅读 代码 最 好 的 方法 是 一 边 阅 读 、 一 边 进 行 必要 的 注释 ， 这 样 可 以 梳 
理 对 别人 代码 的 认识 。 然 后 可 以 run 一 下 ， 看 看 效果 。 当 然 ， 还 可 以 按 
照 目 己 的 设想 进行 必要 修改 ， 然 后 再 run。 经 过 几 轮 ， 就 可 以 将 别人 的 
代码 消化 吸收 了 。 


0.2.3 ”调试 程序 
阅读 是 信息 的 吸收 过 程 ， 写 作 则 是 信息 的 加 工 输出 过 程 。 


要 目 己 动手 写 程序 。“ 一 万 小 时 定律 在 编程 领域 也 十 成 立 的 ， 除 非 你 
天 生 束 是 天 才 ， 否 则 ， 只 有 通过 “一 万 小 时 定律 ”才能 成 为 天 才 。 


在 调试 程序 的 时 候 ， 要 善于 应 用 网 络 ， 看 看 类 似 的 问题 别人 是 如 何 解 
决 的 ， 不 要 仅 局 限于 目 己 的 思维 范围 。 利 用 网 络 束 少 不 了 使 用 搜索 引 
向 那些 要 想 成 为 专家 的 小 工 们 说 ，Google 能 够 帮助 你 成 
大 家 可 


我 不 相信 “三 天 掌握 Python”、“ 三 周 成 为 高 手 ” 之 类 的 让 人 听 起 来 热血 
沸腾 、 展 悍 无 限 的 骄 人 宣传 。 如 采 你 通过 本 书 跟 我 对 话 ， 至 少 说 明 你 
我 都 吓 普 通 人 ， 普 通 人 要 做 好 一 件 事情 ， 除 了 “机 毕 巧 合 ” 遇 到 员 人 之 
外 ， 束 要 靠 目 己 勤学 藻 练 了 ， 没 有 捷径 ， 几 是 宣传 捷径 的 ， 大 多 都 是 


骄子 


/人 


0.3” 安 狐 Python 


任何 高 级 语言 都 需要 一 个 目 己 的 编程 环境 ， 这 了 束 好 比 写字 一 样 ， 需 要 
有 纸 和 笔 ， 在 计算 机 上 写 东 西 ， 也 需要 有 文字 处 理 软件 ， 比 如 各 种 名 


称 的 Office 类 软件 。 笔 和 纸 以 及 Office 软 件 ， 就 是 写 东 西 的 硬件 或 软 
件 ， 总 之 ， 那 些 文字 只 能 写 在 相应 的 硬件 或 软件 上 ， 才 能 最 后 成 为 一 
篇 文章 。 编 程 也 要 有 个 程序 之 类 的 东西 ， 把 代码 写 在 上 面 ， 才 能 形成 
类 似 文章 那样 的 文件 一 一 目 己 编 的 程序 。 


阅读 本 书 的 零 基础 朋友 ， 乃 至 于 非 零 基础 的 朋友 ， 不 要 布 户 在 这 里 学 

到 很 多 高 次 的 Python 语言 技巧 。 重 要 的 是 学 会 一 些 方法 ， 比 如 刚才 给 

大 家 推荐 的 * 上 网 Google 一 下 "”， 束 是 非常 好 的 学 习 方 法 。 互 联网 的 伟 

大 之 处 ， 不 仅仅 在 于 打 游 戏 、 看 看 养眼 的 照片 或 者 各 种 视频 之 类 的 ， 

当 作 娱乐 网 ， 还 要 当 作 知识 网 
0 创造 网 。 


扯 远 了 ， 拉 回来 。 在 学 习 过 程 中 ， 遇 到 一 点 点 疑问 都 不 要 放 过 ， 思 
考 、 按 试 之 后 ， 不 管 有 没有 结果 ， 都 要 Google 一 下 ， 当 然 ， 要 做 到 这 
一 点 ， 需 要 有 点 技术 ， 这 点 技术 对 于 立志 于 成 为 编程 专家 的 读者 来 说 
古 必须 要 掌握 的 。 如 采 阅 读 到 这 里 ， 你 还 没有 理解 ， 那 说 明 的 确 是 我 
的 读者 : 零 基础 。 


《辟邪 证 谱 》 和 《 获 花 宝典 》 这 两 本 志 世 武功 秘籍 ， 对 练功 者 提出 了 
一 个 较 高 的 要 求 : 欲 练 神功 ， 挥 刀 目 言 。 


学 Python， 如 果 要 达到 比较 高 的 水 平 ， 其 实 不 用 目 宫 (如 果 读者 真 的 
要 以 此 明志 ， 该 行为 结 采 与 本 书 的 作者 和 出 版 机 构 无 关 ， 纯 属 个 人 行 
为 。 寿 读者 尚未 成 年 ， 请 在 法 定 监 护 人 的 监护 下 阅读 本 书 ， 特 此 声 
明 ) 。 但 是 ， 需 要 在 你 的 计算 机 中 安装 一 些 东 西 ， 并 且 这 个 过 程 有 时 
比较 耗费 时 间 。 


所 需要 安装 的 东西 ， 都 在 这 个 页 面 里 面 : 


www.python.org/downloads/ ° 


www.python.org 征 Python 的 官方 网 站 ， 如 果 你 的 英语 非常 好 ， 那 么 阅读 
该 网 站 ， 可 以 获得 非常 多 的 收获 。 


在 下 载 页 面 里 面 ， 显 示 出 Python 目前 有 两 大 版 本 : Python 3.x.x 和 
Python 2.7.x。 可 以 说 ，Python 3 是 未 来 ， 它 比 Python 2.7 有 进步 。 但 
是 ， 现 在 还 有 一 些 东西 没有 完全 兼容 Python 3， 所 以 ， 本 书 在 讲解 中 
以 Python 2.7 为 主 ， 兼 顾 Python 3.x。 一 般 而 言 ， 如 果 学 了 Python 2.7， 
再 学 习 Python 3 束 很 容易 ， 因 为 两 者 只 是 某 些 地 方 的 变化 。 请 读者 不 


要 纠结 于 是 学 习 Python 2 还 是 学 习 Python 3 这 种 无 聊 的 问题 ， 如 果 两 个 
差别 达到 让 你 学 了 而 这 个 无 法 使 用 那个 ， 这 将 是 Python 的 灾难 。 绝 顶 
聪明 的 Python 创造 者 和 维护 者 们 ， 绝 对 不 会 允许 这 样 的 事情 出 现 。 


0.3.1_ Ubuntu 系统 

你 的 计算 机 是 什么 操作 系统 的 ?如果 是 Linux 的 某 个 发 行 版 ， 比 如 
Ubuntu， 那 么 就 跟 我 同道 了 。 如 果 是 iOS， 也 一 样 ， 因 为 都 是 UNIX 诬 
下 的 ， 与 在 Ubuntu 中 的 安装 过 程 大 同 小 异 。 只 是 Widows 有 点 男 类 了 。 


但 没关系 ，Python 就 是 跨 平 台 的 ， 它 可 以 在 任何 系统 下 进行 编程 ， 用 
它 写 出 来 的 程序 也 可 以 运行 在 任何 操作 系统 中 。 

但 是 ， 我 个 人 推荐 使 用 Linux/UNIX 系 列 的 操作 系统 。 

正常 情况 下 ， 只 要 安装 了 Ubuntu 这 个 操作 系统 ， 就 已 经 安装 好 了 
Python 的 编程 环境 。 你 只 需要 打开 Shell， 然 后 输入 Python， 单 击 “ 回 
车 ”之 后 就 会 看 到 如 下 内 容 : 


$ python 


Python 2.7.6 (default, Nov 13 2013, 19:24:16) 
[GCC 4.6.3] on linux2 


Type "help", "copyright", "credits" or "license" for more information. 


如 采 没 有 该 编程 环境 ， 束 需要 安装 了 了， 一 种 最 简单 的 方法 : 


$ sudo apt-get install python 


oo 男 外 一 种 比较 矿 烦 的 方法 ， 但 似乎 能 炫 次 一 下 目 己 的 水 平 ， 方法 
I 


[© 


(1) 到 官方 网 站 下 载 源码 。 比 如 : 


wget http://www.python.org/ftp/python/2.7.8/Python-2.7.8.tgz 


(2) 解压 源码 包 


tar -zxvf Python-2.7.8.tgz 


(3) 编译 


cd Python-2.7.8 ./configure --prefix=/usr/local 


这 里 指定 了 安装 目录 /sr/local。 如 果 不 指 定 ， 可 以 使 用 默认 的 ， 直 接 
运行 ./configure 即 可 。 


安装 好 之 后 ， 进 入 Shel， 输 入 Python， 就 会 看 到 结果 。 我 们 将 那个 带 
有 “>>>” 的 界面 称 之 为 python 的 交互 模式 ”。 


0.3.2 Windows 系 统 


到 下 载 页 面 里 找到 Windows 安 装 包 下 载 ， 比 如 下 载 了 这 个 文件 : 
python-2.7.8.msi。 然 后 完成 安装 。 


特别 注意 ， 安装 完 之 后 ， 需 要 检查 系统 环境 变量 是 否 有 Python， 如 果 
没有 ， 就 设置 一 下 。 

以 上 搞定 后 ， 在 cmd 中 ， 输 入 “python”， 得 到 与 前 面 类 似 的 结果 ， 就 说 
明 已 经 安装 好 了 。 

0.3.3 “Mac OS X 系 统 


其 实 根 本 就 不 用 再 写 怎 么 安装 Mac OS X 系 统 了 ， 因 为 用 Mac OS X 的 
朋友 ， 肯 定 是 高 手中 的 高 高 手 了 ， 至 少 我 一 直 很 敬佩 那些 用 Mac OS X 
并 坚持 没有 更 换 为 Windows 的 人 。 


所 笠 的 征用 苹果 电脑 的 束 不 用 安装 了 ， 因 为 里 面 一 定 预 装 好 了 ， 合 过 
来 束 可 以 直接 用 。 

如 琳 按 照 以 上 方法 顺利 安 流 成功， 只 能 说 明 幸 运 。 如 来 没有 安 流 成 
功 ， 则 是 提高 目 己 的 绝 佳 机 会 ， 因 为 只 有 遇 到 问题 才能 解决 问题 ， 才 
能 知道 更 深刻 的 道理 ， 不 要 怕 ， 使 用 Google， 它 能 帮助 你 解决 问题 。 
当然 ， 也 可 以 加 入 QQ 群 或 者 通过 微 博 问 我 。 


0.4 ”集成 开发 环境 (IDE) 


安装 好 Python 之 后 ， 就 可 以 进行 开发 了 。 按 照 惯例 ， 第 一 行 代码 总 
是 : Hello World 。 


0.4.1 ”值得 纪念 的 时 刻 : Hello world 


不 管 你 使 用 的 是 什么 操作 系统 ， 总 之 肯定 能 够 找到 一 个 地 方 运行 
Python， 进 入 到 交互 模式 ， 像 下 面 一 样 : 


Python 2.7.6 (default，Nov 13 2013, 19:24:16) 
[GCC 4.6.3] on Linux2 


Type "help", "copyright", "credits" or "license" for more information. 


在 “>>>” 后 面 输入 print"Hello，World"， 并 按 回 车 键 ， 下 面 是 见证 奇迹 
的 时 刻 。 


>>> print "Hello, World" 


Hello, World 


如 采 你 从 来 不 伐 编 程 ， 那 么 从 这 一 刻 起 ， 束 路 入 了 程序 员 行列 ;如 采 
已 经 是 程序 员 ， 那 么 区 ® 温 习 一 下 当初 的 惊喜 吧 ! 


“Hello，World” 是 你 用 代码 向 这 个 世界 打招呼 了 。 


每 个 程序 员 ， 都 曾经 经 历 过 这 个 伟大 时 刻 ， 不 经 历 这 个 伟大 时 刻 的 程 
序 员 不 是 伟大 的 程序 员 。 为 了 纪念 这 个 伟大 时 刻 ， 理 解 其 伟大 之 所 
在 ， 下 面 执行 分 解 动作 : 


说 明 : 在 下 面 的 分 解 动作 中 ， 用 到 了 符号 "#'， 这 个 符号 在 Python 编程 
中 表示 注释 。 所 请 注释 ， 束 古 在 计算 机 中 不 执行 那 句 话 ， 只 是 为 了 说 
明 某 行 语句 表达 什么 意思 ， 是 给 计算 机 前 面 的 人 看 的 。 等 别提 醒 ， 在 
编程 实践 中 ， 注 释 是 必须 的 ， 尽 管 很 多 人 要 求 代 码 要 具有 可 读 性 ， 但 
必要 的 注释 也 是 少不了 的 。 请 牢记 : 程序 在 大 多 数 情 况 下 是 给 人 看 
的 ， 只 是 偶尔 让 计算 机 执行 一 下 。 


# 看 到 “>>>” 符 号 ， 表 示 Python 做 好 了 准备 ， 等 竺 你 癌 它 发 出 指令 ， 让 
它 做 事情 。 


#print， 意 思 是 打印 。 在 这 里 也 是 这 个 意思 ， 是 有 要求 Python 打印 东西 。 


>>> print 


#"Hello,World" 是 打印 的 内 容 ， 注 意 ， 双 引号 是 英文 状态 下 的 。 引 二 不 
征 打印 内 容 ， 它 相当 于 一 个 包 圳 ， 把 打印 的 内 容 包 起 来 ， 统 一 交 给 
Python。 


>>> print "Hello, World" 


# 上 面 命令 执行 的 结 有 末 。Python 接 收 到 你 要 求 它 所 做 的 事情 : 打印 
Hello,World， 于 是 它 束 老 老实 实地 执行 这 个 命令 ， 丝 台 不 走样 。 


Hello, World 


在 Python 中 ， 如 琳 进 入 了 上 面 的 样式 ， 就 十 进入 了 “交互 模式 ”。 这 十 
非常 有 用 而 且 商 单 的 模式 ， 便 于 我 们 进行 各 种 学 习 和 探索 ， 随 看 学 习 
的 深入 ， 你 将 更 加 觉得 它 魅 力 四 射 。 


笑 一 笑 : 有 一 个 程序 员 ， 感 觉 目 己 书 法 太 烂 了 ， 于 是 立志 继承 光 采 文 
化 传统 ， 购 买 了 笔 丢 纸 砚 。 在 某 天 开始 练 字 ， 将 纸 铺 好 ， 拿 起 笔 芯 K 足 
墨水 ， 挥 毫 在 纸 上 写 下 了 两 个 大 字 : Hello World 。 


虽然 进入 了 程序 员 序 列 ， 但 是 ， 如 采 程 序 员 用 这 个 工具 仅仅 是 打 

印 *Hello，World”， 又 怎 能 用 “伟大 "来 形容 呢 ? 况且 这 个 工具 也 太 人 简陋 
了 。 你 看 美工 妹妹 用 的 Photoshop， 行 政 妹妹 用 的 Word， 出 纳 妹妹 用 的 
Excel， 束 连坐 在 老板 保 后 面 的 那个 家 伙 也 在 用 PPT 播 放 目 己 都 不 相信 
0 难道 我 们 伟大 的 程序 员 ， 殊 用 这 么 简陋 的 工具 来 写 旷 世 
FO 


当然 不 是 。 软 件 是 谁 开 发 的 ? 程序 员 。 程 序 员 肯定 会 先 为 目 己 打造 好 
用 的 工具 ， 这 也 叫 作 “近水楼台 先 得 月 ”。 


IDE 束 是 程序 员 的 工具 。 
0.4.2 ”集成 开发 环境 概述 


IDE 的 全 称 是 : Integrated Development Environment， 人 简称 IDE， 也 称 为 
Integration Design Environment 或 Integration Debugging Environment， 翻 


. 中 文 叫 作 * 集 成 开发 环境 "， 它 是 一 种 辅助 程序 员 开 发 用 的 应 用 软 


维基 百科 这 样 对 IDE 定 义 : 


IDE 通 党 包括 程序 语言 编辑 器 、 目 动 建立 工具 和 除 错 右 。 有 些 IDE 包 合 
编译 程序 和 直译 器 ， 如 微软 的 Microsoft Visual Studio， 有 些 则 不 包 

含 ， 如 Eclipse、SharpDevelop 等 ， 这 些 IDE 是 通过 调用 第 三 方 编译 右 来 
实现 代码 的 编译 工作 的 。 有 时 IDE 还 会 包含 版 本 控制 系统 和 一 些 可 以 
设计 图 形 用 户 界 面 的 工具 。 许 多 文 持 面向 对 象 的 现代 化 IDE 还 包括 类 
别 浏 斋 器 、 对 象 查 看 右 、 对 象 结构 图 。 虽 然 目前 有 一 些 IDE 文 持 多 种 
程序 语言 〈 例 如 Eclipse、NetBeans、Microsoft Visual Studio) ， 但 是 一 
般 而 言 ， 主 要 还 是 针对 特定 的 程序 语言 而 量 身 打造 (例如 Visual 


Basic) 。 


如 图 0-3 所 示 是 微软 提供 的 名 字 叫 作 Microsoft Visual Studio 的 IDE， 用 
C# 进 行 编程 的 程序 员 都 用 它 。 


4 us 
5 | using System.Windows.Forms 


7 snamespace WindowsFormsApplication1 
8 |{ 
{ 


神 肌 局 rs 人 
53 可 志方 实 >|I0 


两 月 站 守 
有 击 民 克 光洁 党 中 的 成 避 多 称 ， 咎 后 将 去 ` 下 容 调 用 各 次 党 网" 可 在 比 工具 本 
口中 查 者 或 严 的 风 用 后 次 培 构 、 


图 0-3 ”名 叫 Microsoft Visual Studio 的 IDE 


如 图 0-4 所 示 是 在 苹果 电脑 中 出 现 的 名 叫 XCode 的 IDE 。 


要 想 了 解 更 多 IDE 的 信息 ， 推 荐 阅读 维基 百科 中 的 词 条 。 


。 英文 词 条 : Integrated development environment 


。 中 文 词 条 : 集成 开发 环境 


AAn Im FindBarView.mm - Camino 
Base SDK | Development | Camino | .. Q- String Matchin 


Groups & Files ,| Na 
" 国 Camino 加 ContentClickListener.mm 
» xcode Configs 回 Findh 
加 


vO Classes FindgarController.h 
> 国 Appliation 加 FinddarController.mm 
| Browser Window Hj FindaarView.n 
Gecko Embedding [Te | 
Apple Events E PageProxylcon.h 


ockmarks 咱 PageProxyicon.mm 


[9 Downloads 加 SatusBarviewh 
History 区 
让] Dialogs | 4 而 FindBarView.mm:1 2 <No selected symbol> < 5 下 

日 


二 Form Fil - (void)windowKeyStatusChanged: (NSNotification *)aNotification 
web Search { 
区 UlComponents 
[Backend Components 
a categories — (void)drewRect; (NSRect)oaRect 
PreferencePanes { 


lself setNeedsDisplay:YES]; 


1/ Only draw a gradient if the window is nain; this isn't the way these bars 
Other Sources 171 ususally work, but it is how the 05 dravs the status bar, and since the 
[Resources /1 find bar lives ot the bottom of the window it looks better to match that, 
Plugins + ([NSWorkspace isLeopardOrHigher] && [lself window] isMainWindow]) { 
NSColor# startColor = [NSColor colorWithDeviceWhite: (233.8/255.8) aLpha' .9]; 
frommworks NSColor# endColor = [NSColor colorWithDevicewhite:(207.0/255.90) alpna:1.0]; 
pl Products 
的 cecko NSRect bounds ~ [self bounds]; 
NSRect gradientRect = NSMakeaect|aRect,origin.x, @, 
aRect,.size.width, bounds.size.neignt -~ 1.0); 


国 国 vv 


[Target Plists 
»@ Tarsets 
< Executables cd a = ee 
S CHGradient alloc) initWithStartingColor:startColor 
YY 9 
Results endingColor:endColor] autoreleasel:; 
PL aookmarks lbackgroundGradient drawInAect:gradientRect angte:279.9]; 
上 卫 ScM } 
克 Project Symbols 
> 全] Implementation Files 
上 国 Interface Builder Files i/ optinize drowing oa bit so we're not +alwvays+ redrowing our top header, Only 
1/ draw it the area wetre asked to drav overlaps with the top line. 
NSRect bounds = {self bounds]; 
if (NSMoxY(bounds) <= NSHMaxY{(oRcct}) { 
NSPoint leftPoint ~ NSMakePoint[bounds,.origin.x, bounds,origin,y + bounds,size.height); 
NSpoint rightpoint = NSMakepoint[bounds.origin.x + bounds.size.width, bounds.origin.y + bounds.siz 
INSBezierPath strokeLineFrompoint: leftPoint toPoint:rightPoint]; 


Isuper drawRect:aRect]; 


图 0-4 ”名 叫 XCode 的 IDE 


0.4.3 Python 的 IDE 


用 Google 搜 索 一 下 : Python IDE， 会 发 现 能 够 进行 Python 编程 的 IDE 还 
真 不 少 。 东 西 一 多 就 容易 无 所 适 从 ， 所 以 有 不 少 人 都 问 用 哪个 IDE 
好 。 可 以 看 看 下 面 链 接 里 的 内 容 : 


http://stackoverflow.com/questions/81584/what-ide-to-use-for-python ° 


顺便 推荐 一 个 非常 好 的 与 开发 相关 的 网 站 : stackoverflow.com。 在 这 
里 可 以 提问 ， 可 以 查看 答案 。 如 果 有 问题 ， 一 般 先 在 这 里 查找 ， 大 多 
数 情况 都 能 找到 非常 满意 的 结果 ， 且 有 很 大 局 发 。 


那么 作为 零 基础 的 学 习 者 ， 用 哪个 IDE 好 呢 ? 既然 是 零 基 础 ， 束 别 频 
hs 跷 用 Python 目 带 的 IDLE， 原 因 束 是: 简单 ， 虽 然 它 比较 稍 
办 oO 


在 Windows 中 ， 通 过 “开始 ”菜单 >“ 所 有 程序 ” “Python 2.x 一 “IDLE 
(Python GUI) ”来 启动 IDLE。 启 动 之 后 ， 看 到 如 图 0-5 所 示 的 界面 。 


Ie python Shell 


File Edit Debug Options Windows Help 
Type mpy i ts" or "license for more information. 


3 (default, Feb 27 2014, 20:00:17) 


图 0-5 ” IDLE 界面 


注意 ; 奉 看 到 的 界面 显示 和 版 本 与 这 个 和 独 不 同 ， 则 说 明 安 私 的 版 本 不 
同 ， 但 大 人 致 模样 差不多 。 


其 他 操作 系统 的 用 户 ， 也 都 能 在 启动 IDLE 这 个 程序 之 后 ， 出 现 与 上 面 
一 样 的 图 。 


这 里 其 实 是 Python 的 交互 模式 编程 环境 。 


当然 还 有 一 个 文本 环境 ， 读 者 可 以 在 File 沫 单 中 新 建 一 个 文件 ， 即 进 
入 文本 编辑 环境 。 


9 还 有 很 多 其 他 的 IDE， 列 出 来 ， 供 喜欢 扩 腾 的 朋 


。 PythonWin: 是 Python Win32 Extensions 〈 半 官方 性 质 的 Python for 
win32 增 强 包 ) 的 一 部 分 ， 也 包含 在 ActivePython 的 Windows 发 行 
版 中 。 如 其 名 字 所 言 ， 只 针对 Win32 平 侣 。 


。 MacPython IDE: MacPythonIDE 是 Python 的 Mac OS 发 行 版 内 置 的 
IDE， 可 以 看 作 是 PythonWin 的 Mac 对 应 版 本 ， 由 Guido 的 哥哥 Just 
van Rossum 编 写 。 

。 Emacs 和 Vim: Emacs 和 Vim 号 称 是 这 个 星球 上 最 强大 的 文本 编辑 
髓 ， 对 于 许多 程序 员 来 说 是 万 能 IDE 的 不 二 选择 。 

。 Eclipse+PyDev: Eclipse 是 新 一 代 的 优秀 泛 用 型 IDE， 虽 然 是 基于 
Java 技 术 开 发 的 ， 但 出 色 的 架构 使 其 具有 不 还 于 Emacs 和 Vim 的 可 
扩展 性 ， 现 在 已 经 成 为 了 许多 程序 员 最 爱 的 瑞士 军刀 。 


磨 刀 不 族 砍 染 工 ，IDE 已 经 有 了 ， 伟 大 程序 员 束 要 开始 从 事 伟 大 的 编 
程 工 作 了 。 


第 1 草 ”基本 的 对 象 尖 型 


在 Python 中 ,“ 万 物 窒 对 象 ?”， 在 一 开始 束 这 么 提出 来 ， 如 果 你 没有 理 
解 ， 也 不 用 为 此 吃 不 好 、 睡 不 好 ， 就 当 听 了 一 个 新 名 词 ， 因 为 对 于 “对 
象 " 的 理解 ， 可 以 说 要 贯穿 全 书 ， 甚 至 贯穿 你 的 代码 生涯 。 随 着 实践 的 
增多 ， 对 于 “万 物 赂 对象" 的 领悟 会 逐渐 深化 。 


什么 是 对 象 ? 现在 暂时 不 给 出 定义 ， 一 定 要 等 到 时 机 成 熟 的 时 候 给 出 
定义 才能 理解 。 


如 果 要 准确 描述 Python 对 象 ， 需 要 从 “身份 、 类 型 、 值 三 个 维度 来 描 
述 ， 这 三 个 维度 也 构成 了 一 个 对 象 的 特征 。 至 于 怎样 从 上 述 三 个 维度 
来 描述 对 象 ， 本 章 将 以 Python 中 基本 的 对 象 类 型 为 例 进 行 说 明 。 如 果 
换 一 种 说 法 ， 也 可 以 理解 为 本 章 将 带领 你 了 解 python 中 的 某 些 常用 的 
和 基本 类 型 的 对 象 。 


11 数字 


现在 更 多 人 把 计算 机 叫 作 电 脑 ， 英 文 是 Computer。 只 要 提 到 它 ， 兽 i 
Ls 会 想到 它 能 够 比较 快 地 做 加 减 乘除 ， 甚 至 乘 方 、 开 方 等 各 种 数学 i 


有 一 篇 名 为 《计算 机 前 世 》 的 文章 (参见 : 
http://www.flickering.cn) ， 这 样 讲 到 : 


先 来 看 看 计算 机 (Computer) 这 个 词 是 怎么 来 的 。 英 文学 得 好 的 小 伙 
伴 看 到 Computer， 第 一 反应 是 : “compnute-er”， 应 该 是 个 什么 样 的 人 
吧 ， 对 , “做 计算 的 人 ”。 叮 吃 ! 恭喜 你 答对 了 “。 最 先 被 命名 为 
Computer 的 确实 是 人 。 也 就 是 说 ， 电 子 计 算 机 (与 早期 的 机 械 计算 
机 ) 被 赋予 这 个 名 字 是 因为 他 们 执行 的 是 被 分 配 到 的 人 的 工作 。* 计 算 
机 ”原来 是 工作 岗位 ， 它 被 用 来 定义 一 个 工种 ， 其 任务 是 执行 计算 ， 诸 
如 导航 表 、 潮 涩 图 表 、 天 文 历 书 和 行星 的 位 置 要 求 等 的 重复 计算 ， 从 
事 这 个 工作 的 人 就 是 Computer， 而 且 大 多 是 女神 。 


原文 还 附 有 如 图 1-1 所 示 的 图 片 。 


所 以 ， 以 后 要 用 第 三 人 称 来 称呼 Computer， 请 用 She (她 ) 。 现 在 你 明 
日 为 什么 程序 员 中 那么 多 “他 ”了 吧 ， 因 为 Computer 是 “她 ”。 


图 1-1 从事 Computer 工 作 的 人 


111 数学 
在 Python 中 ， 对 数 的 规定 比较 简单 ， 达 到 了 小 学 数学 水 平 即 可 理解 。 


首先 ， 进 入 到 Python 的 交互 模式 中 ， 不 管 是 什么 操作 系统 ， 相 信 你 总 
能 找到 那个 交互 模式 。 然 后 模仿 下 面 的 操作 : 


>>> 3 

3 

>>> 3333333333333333333333333333333333333333 
3333333333333333333333333333333333333333L 
>2>> 3.222222 


22 


在 交互 模式 下 ， 如 琳 输 入 3， 束 显示 了 3， 这 样 的 数 称 为 整数 ， 这 个 称 
呼 和 小 学 数学 一 样 。 


当 输 入 一 个 比较 大 的 整数 时 ，Python 会 自动 将 这 个 大 整数 进行 转换 ， 
转换 的 结果 是 一 个 “长 整数 ”类 型 ， 为 了 表示 它 ， 会 在 其 末尾 显示 一 个 
L。 由 于 这 个 操作 是 Python 目 动 完成 的 ， 所 以 在 现在 的 Python 中 ， 没 有 
单独 将 “长 整数 ”作为 一 个 类 型 。 


3.222222 在 数学 里 面 称 为 小 数 ， 这 里 依然 可 以 这 么 称呼 ， 不 过 束 像 很 
多 编程 语言 一 样 ， 习 惯 称 之 为 “ 浮 点 数 ”。 至 于 这 个 名 称 的 由 来 ， 也 是 
有 所 说 道 的 ， 有 兴趣 可 以 搜索 一 下 。 


上 述 举 例 中 都 无 符号 (或 者 说 是 非 负 数 ) ， 如 果 要 表示 负数 ， 跟 数学 
中 的 表示 方法 一 样 ， 前 面 填 上 人 负 号 即 可 。 


值得 注意 的 是 ， 我 们 这 里 说 的 都 是 十 进 制 的 数 。 

除了 十 进 制 ， 还 有 二 进 制 、 八 进 制 、 十 六 进 制 都 是 在 编程 中 可 能 用 到 
的 ， 这 些 知 识 不 作为 本 书 讲解 的 内 容 ， 读 者 要 了 解 ， 可 以 寻找 相关 书 
籍 ， 或 者 去 网 上 搜索 。 


每 个 数字 在 Python 中 都 是 一 个 对 象 ， 比 如 前 面 输入 的 3 束 是 一 个 对 象 。 
每 个 对 象 ， 在 内 存 中 都 有 自己 的 一 个 地 址 ， 这 就 是 它 的 身份 。 


>>> id(3) 


140574872 

>>> id(3.222222) 
140612356 

>>> id(3.0) 


140612356 


用 内 建 画 数 id0) 可 以 查看 每 个 对 象 的 内 存 地 址 ， 即 身份 。 


内 建 画 数 ， 英 文 为 built-in Function， 读 者 根据 名 字 也 能 猜 个 八 九 不 离 
十 了 。 不 错 ， 束 是 Python 中 已 经 定义 好 的 内 部 函数 。 


以 上 三 个 不 同 的 数字 是 三 个 不 同 的 对 象 ， 具 有 三 个 不 同 的 内 存 地 址 。 
特别 要 注意 ， 在 数学 上 ，3 和 3.0 是 相等 的 ， 但 是 在 这 里 ， 它 们 是 不 同 
的 对 象 。 

用 id0 得 到 的 内 存 地 址 是 只 读 的 ， 不 能 修改 。 


了 解 了 “身份 ”再 来 看 “类 型 *， 也 有 一 个 内 建 贸 数 供 使 用 ，Bhtype() 。 


>>> type(3) 


<type 'int'> 

>>> type(3.0) 
<type 'float'> 
>>> type(3.222222) 


<type 'float'> 


<type'inb> 说 明 3 是 整数 类 型 (Interger) ; <type‘float*> 则 告诉 我 们 该 
对 象 是 浮 点 型 (Floating point real number) 。 与 id0 的 结果 类 似 ，typeg) 
得 到 的 结果 也 是 只 读 的 。 

至 于 对 和 象 的 值 ， 在 这 里 就 是 对 象 本 刁 。 

看 来 对 象 也 不 难 理解 。 

请 保持 自信 ， 继 续 。 


1.1.2 ”变量 


仅仅 写 出 “3、4、5” 古 远 远 不 够 的 ， 在 编程 中 ， 经 常 要 用 到 “ 变 
量 ” 和 "“ 数 ”严格 来 讲 是 对 象 ) 建立 起 对 应 关系 。 例 如 


>x=5 


在 这 个 例 了 于 中 ，x=5 束 是 在 变量 x 和 数 5 之 间 建 立 了 对 应 关系 ， 接 着 又 
建立 了 x 与 6 之 间 的 对 应 关系。 我 们 可 以 看 到 ，x 先 “是 ”5， 后 来 “是 ”6 。 


在 Python 中 ， 有 这 样 一 句 话 是 非常 重要 的 :对象 有 类 型 ， 变 量 无 类 型 
。 怎么 理解 呢 ? 


对 象 的 类 型 ， 可 以 使 用 type0 来 查看 ， 前 面 已 经 演示 了 。 


当 在 Python 中 写 入 了 5、6，Compnuter 束 和 目 动 在 其 内 存 中 某 个 地 方 建立 
了 这 两 个 对 象 ， 就 好 比 建造 了 两 个 雕塑 ， 一 个 形状 似 5， 一 个 形状 似 
6， 这 两 个 对 象 的 类 型 就 是 Int. 


那个 x 就 好 比 是 一 个 标签 ， 当 x=5 时 ， 就 是 将 x 这 个 标签 挫 在 了 5 上 ， 通 
过 这 个 x， 束 顺延 看 天 了 5， 于 是 在 交互 模式 中 , “>>>x” 输 出 的 结 采 整 
征 5， 给 人 的 感觉 似乎 是 x 吏 是 5， 而 事实 是 x 这 个 标签 贴 在 5 上 面 。 同 样 
的 道理 ， 当 x=6 时 ， 标 签 就 换 位 置 了 ， 贴 到 6 上 面 。 


所 以 ， 这 个 标签 x 没有 类 型 之 说 ， 它 不 仅 可 以 贴 在 整数 类 型 的 对 象 上 ， 
J 比如 后 面 会 介绍 到 的 str (字符 串 ) 类 型 
对象 等 。 


( 即 可 以 四 处 乱 贴 的 标签 ) 非常 重要 ， 它 没 


1.1.3 ”人 稍 单 的 四 则 运算 
读者 可 以 在 交互 模式 中 复习 一 下 小 学 数学 中 的 四 则 运算 ， 并 且 报告 给 


ee 他 (她 ) 当初 化 费 否 心 的 教育 成 果 在 这 里 得 到 了 应 


另外 ， 我 相信 读者 已 经 发 现 了 一 个 重要 的 公理 : 
计算 机 中 的 四 则 运算 和 小 学 数学 中 学 习 过 的 四 则 运算 规则 是 一 样 的 


要 不 怎么 说 人 是 高 等 动物 呢 ， 上 自己 发 明 的 东西 ， 一 定 要 继承 自己 已 经 
掌握 的 知识 ， 别 跟 上 自己 的 历史 过 不 去 。 伟 大 的 科学 家 们 ， 在 当初 设计 
计算 机 的 时 候 就 想到 我 们 现在 学 习 的 需要 了 ， 一 定 不 能 让 后 世子 孙 再 
， 束 用 小 学 数学 里 面 的 好 了 。 感 谢 那 些 科 学 家 先驱 

， 泽 丰 口 


下 面 计算 3 个 算术 题 ， 看 看 结果 十 什么 : 


4.9 + 2.0 


你 可 能 层 怒 了 ， 这 么 简单 的 题目 ， 殊 不 要 劳 驾 计算 机 了 ， 太 浪 绵 了 。 


>>> 4+2 


不 一 样 的 地 方 是 : 第 一 个 公式 结 采 是 6， 这 是 一 个 整数 ， 后 面 两 个 是 
6.0， 这 走 浮 点 数 。 


计算 机 做 一 些 四 则 运算 是 不 在 话 下 的 ， 但 是 ， 有 一 个 问题 请 务必 注 
整数 是 可 以 无 限 大 的 ， 但 是 在 计算 机 中 ， 整 数 不 能 


因此 ， 束 会 有 某 种 情况 出 现 ， 就 是 参 与 运算 的 数 或 者 运算 结果 超过 了 
计算 机 中 最 大 的 数 了 ， 这 种 问题 称 之 为 "整数 溢出 问题 ”。 


1.1.4 整数 次 出 问题 
在 网 上 和 能够 找到 很 多 专门 讨论 “整数 洪 出 ”问题 的 文章 。 


在 某 些 高 级 编程 语言 中 ， 整 数 盗 出 是 必须 正视 的 ， 但 是 ， 在 Python 里 
面 就 无需 忧 黎 了 ， 原 因 就 十 Python 为 我 们 解决 了 这 个 问题 ， 它 文 持 “ 无 
限 精 度 ” 的 整数 ， 所 以 ， 不 用 堵 虑 整数 洲 出 的 问题 ，Int 类 型 与 任意 精 
度 的 Long 整 数 类 可 以 无 颖 转换 ， 超 过 Int 筷 围 的 情况 都 将 转换 成 Long 类 


型 。 


体验 一 下 大 整数 : 


>>> 123456789870987654321122343445567678890098876*1233455667789990099876543332387665443345566 


152278477193527562870044352587576277277562328362032444339019158937017801601677976183816L 


多 么 竺 运 呀 ，Python 做 了 如 此 精妙 的 安排 ， 免 除了 麻烦 ， 所 以 选择 学 
习 Python 融 是 珍惜 光阴 。 


你 还 可 以 在 交互 模式 下 计算 2 的 1000 次 需 ， 计 算 方 法 是 : 
看 看 结果 是 什么 ? 你 会 感到 惊喜 的 。 


上 面 计算 结果 的 数字 最 后 有 一 个 站 ， 表 示 这 个 数 是 一 个 长 整数 ， 你 不 
用 管 它 ， 反 正 是 Python 为 我 们 搞定 了 大 整数 问题 。 


1.2 ”除法 


用 单独 一 个 章 世 来 说 明 除法 ， 吏 是 因为 它 常 利 会 市 来 及 硕 ， 不 仅 
Python 会 这 样 ， 很 多 高 级 语言 都 如 此 。 


1.2.1 整数 与 整数 相 除 


进入 Python 交互 模式 之 后 ， 练 习 下 面 的 运算 : 


看 到 了 吗 ? 麻烦 出 来 了 (这 是 在 Python 2.x 中 ) ， 按 照 数 学 运算 ， 以 上 
四 个 运算 结果 都 应 该 是 0.4。 但 我 们 看 到 第 一 个 结果 居然 是 0。Why? 
在 Python (严格 说 是 Python 2.x 中 ，Python3 会 有 所 变化 ) 里 面 有 一 个 规 
定 ， 像 2/5 这 样 的 除法 要 取 整 《就 是 去 掉 小 数 ， 但 不 是 四 舍 五 入 ) 。2 
除 以 5， 商 是 0 (整数 ) ， 余 数 是 2 (整数 ) 。 如 果 用 这 种 形式 : 2/5， 
那么 计算 结果 就 是 两 那个 整数 。 或 者 可 以 理解 为 ， 整数 除 以 整数 ， 结 
果 是 整数 〈 商 ) 


比如 : 


再 次 提醒 : 得 到 是 商 (整数 ) ， 而 不 是 得 到 含有 小 数位 的 结果 再 通 
过 “四 舍 五 入 ”得 到 整数 。 例 如 : 5/2， 得 到 的 商 是 2， 人 余数 是 1， 最 终 
5/2=2， 并 不 是 对 结果 进行 四 舍 五 入 得 到 3。 

1.2.2 ” 浮 点 数 与 整数 相 除 

“ 浮 点 数 与 整数 相 除 ”用 一 种 貌似 严格 的 语言 表 壕 : 


假设 : x 除 以 yY。 其 中 x 可 能 是 整数 ， 也 可 能 是 译 点 数 ; y 可 能 是 整数 ， 
也 可 能 是 浮 点 数 ， 但 两 者 之 中 至 少 有 一 个 是 浮 点 数 。 


出 结论 之 前 ， 还 是 先 在 交互 模式 中 做 实验 : 


>>> 9.0 / 2 


4.5 


束 如 同 做 物理 、 化 学 实验 一 样 ， 仔 细 观 察 上 面 的 实验 结 有 末 ， 能 得 出 什 


么 结论 ? 
不 管 是 被 除数 还 是 除数 ， 只 要 有 一 个 数 是 浮 点 数 ， 结 果 就 是 浮 点 数 。 


然而 ， 下 面 的 实验 可 能 义 让 你 有 点 糊 涂 了 : 


>>> 190.9 /3 


3.3333333333333335 


这 个 是 不 是 就 有 点 搞怪 了 ? 按照 数学 知识 ， 应 该 是 3.33333...， 后 面 是 3 
的 循环 了 ， 那 么 你 的 计算 机 就 集 不 下 来 了 ， 满 屏 都 是 3。 为 了 避免 这 
个 ，Python 武 断 终 结 了 和 循环， 但是， 可 悲 的 是 没有 按照 "四舍五入 ”的 
原则 终止 。 当 然 ， 还 会 有 更 奇 酷 的 出 现 : 


这 


9.30000000000000004 
2 

0.0 
二 
5.551115123125783e-17 
人 


9.10000000000000003 


越 来 越 糊涂 了 ， 为 什么 Computer 姑 娘 在 计算 这 么 简单 的 问题 上 ， 如 此 
糊涂 了 呢 ? 


不 是 Computer 姓 女 糊 涂 ， 她 依然 冰雪 聪明 。 


原因 在 于 十 进 制 和 二 进 制 的 转换 上 ，Computer 好 娟 用 的 古 二 进 制 进行 
计算 ， 上面 的 例子 中 ， 我 们 输入 的 古 十 进 制 ， 束 要 把 十 进 制 的 数 转 化 


为 二 进 制 ， 然 后 再 计算 。 但 是 ， 在 转化 中 ， 浮 点 数 转 化 为 二 进 制 ， 谍 
出 问题 了 。 


例如 十 进 制 的 0.1， 转 化 为 二 进 制 是 : 
0.0001100110011001100110011001100110011001100110011... 


也 就 是 说 ， 转 化 为 二 进 制 后 ， 不 会 精确 等 于 十 进 制 的 0.1。 同 时， 计算 
机 存储 的 位 数 是 有 限制 的 ， 所 以 ， 束 出 现 了 上 壕 现 象 。 


这 各 问题 不 仅仅 在 Python 中 有 所 有 支持 浮 点 数 运算 的 编程 语言 都 会 
遇 到 。 


明日 了 问题 原因 ， 怎 么 解决 呢 ? 就 Python 的 浮 点 数 运算 而 言 ， 大 多 数 
计算 机 每 次 计算 误差 不 超过 2 的 53 次 方 分 之 一 。 对 于 大 多 数 任务 这 已 经 
足够 了 ,但 十 要 在 心中 记 住 这 不 是 十 进 制 算法 ， 每 个 浮 点 数 计 算 可 能 
会 市 来 一 个 新 的 伟人 错误 。 


一 般 情 况 下 ， 只 要 简单 地 将 最 终 显 示 的 结 采 用 “四 舍 五 入 ”到 所 期 望 的 
十 进 制 位 数 ， 束 会 得 到 期 望 的 最 终结 果 。 


对 于 需要 非常 精确 的 情况 ， 可 以 使 用 decimal 模 块 (关于 “模块 "， 后 面 
会 介绍 ， 这 里 暂 存 )  ， 它 实现 的 十 进 制 运算 适合 局 精度 要 求 的 应 用 。 
另外 fractions 模 块 文 持 必 外 一 种 形式 的 运算 ， 写 实现 的 运算 基于 有 理 数 
(因此 像 1/3 这 样 的 数字 可 以 精确 地 表示 ) 。 最 高 要 求 则 是 使 用 由 
SciPy 提 供 的 Numerical Python 包 和 其 他 用 于 数学 和 统计 学 的 包 。 列 出 
这 些 东 西 ， 仅 仅 是 让 读者 明日 ， 问 题 已 经 解决 ， 并 且 方 式 很 多 。 


1.2.3 引用 模块 解决 除法 问题 


Python 之 所 以 受 人 欢迎 ， 一 个 很 重重 要 的 原因 束 是 “轮子 多， 当然 这 
苹 比 喻 ， 殊 好 比 你 要 跑 得 快 ， 怎 么 办 ? 光 天 天 练习 跑步 也 是 不 行 的 ， 
还 要 用 轮子 。 找 辆 目 行 车 ， 殊 快 了 很 多 ， 奋 还 嫌 不 够 快 ， 再 换 电 瓶 
车 、 汽 车 、 高 铁 ..…... 有 反正 可 以 供 你 选择 的 很 多 。 但 是 ， 这 些 让 你 跑 得 
快 的 东西 ， 多 数 不 是 你 目 己 造 的 ， 是 别人 造 好 了 你 来 用 。 甚 至 两 条 腿 
也 是 感谢 父母 恩赐 。 正 是 因为 轮子 多 ， 可 以 选择 的 多 ， 就 可 以 有 各 种 
不 同 的 速度 译 受 了 。 


轮子 是 人 类 伟大 的 发 明 。 


Python 束 是 这 样 ， 有 各 种 “轮子 ” 供 我 们 选用 。 只 不 过 那些 “轮子 ”在 
Python 里 面 的 名 字 不 叫 目 行车 、 汽 车 ， 而 叫 “ 模 块 >， 有 的 还 叫 

作 “ 库 ” SS “类 >» 加 

皇 么 用 ? 可 以 通过 以 下 两 种 形式 。 


形式 1: import module-name。import 后 面 跟 空 格 ， 然 后 是 模块 名 称 ， 
例如 : import os。 


形式 2: from modulel import module11。module1l 是 一 个 大 模块 ， 里 面 
还 有 子 模块 module11， 只 想 用 module11， 束 这 人 么 写 。 


找 一 个 解决 除法 问题 的 轮子 : 


"We 那么 不 管 什 么 情况 ， 都 能 得 到 浮 点 数 的 结 


这 束 是 “轮子 ”的 力量 。 
本 天 国 
前 面 计算 5/2 的 时 候 ， 商 是 2， 余 数 是 1 


余数 怎么 得 到 ? 在 Python 中 《其 实 大 多 数 语言 也 如 此 ) ， 用 % 符 号 来 
取得 两 个 数 相 除 的 余数 。 


实验 下 面 的 操作 : 


>>> 5.0 % 2 


利用 符号 “%” 可 以 得 到 两 个 数 (可 以 是 整数 ， 也 可 以 是 浮 点 数 ) 相 除 
的 余数 。 


除了 利用 “%” 符 号 之 外 ， 还 可 以 使 用 内 建 画 数 ， 完 成 同样 的 工作 。 


>>> divmod(5,2) # 表 示 5 除 以 2， 返 回 了 商 和 余数 


(2, 1) 

>>> divmod(9,2) 
(4, 1) 

>>> divmod(5.0,2) 


(2.0, 1.0) 


内 建 钞 数 divmod0O 返 回 的 是 两 个 值 ， 这 两 个 值 在 一 个 圆 括 号 内 ， 圆 括 
号 内 的 数 子 第 一 个 表示 两 ， 第 二 个 表示 余数 。 


1.2.5 ”四舍五入 


“四 舍 五 入 ”在 运算 中 是 经 常 允 到 的 ， 按 照 我 们 已 经 对 Python 的 理解 ， 
其 应 该 提供 一 个 位 单 的 方法 。 的 确 是 ， 有 一 个 内 建 钞 数 : round0 。 


>>> round(1.234567, 2) 


>>> round(1.234567, 3) 


>>> roun d(16.0/3, 4) 


在 round0 中 的 第 二 个 数 ， 表 示 要 保留 的 小 数位 数 ， 返 回 值 是 一 个 四 舍 
五 入 之 后 的 数值 。 


简单 吧 ? 越 简单 的 时 候 ， 越 要 小 心 ， 当 你 过 到 下 面 的 情况 ， 束 会 有 点 
儿 怀 疑 : 
>>> round(1.2345,3) 


>>> round(2.235,2) 


2.23 # 应 该 是 : 2.24 


哈哈 ， 我 发 现 了 Python 的 一 个 Bug， 太 激动 了 。 


别 那么 激动 ， 如 采 真 的 是 Bug， 还 这 么 明显 ， 有 是 轮 不 到 我 的 。 为 什 
么 ? 具体 解释 看 这 里 ， 下 面 摘 隶 官方 文档 中 的 一 段 话 : 


Note:The behavior of round()for floats can be surprising:for example, 
round (2.675, 2) gives 2.67 instead of the expected 2.68.This is not a 
bug:it’s a result of the fact that most decimal fractions can’t be represented 
exactly as a float.See Floating Point Arithmetic:Issues and Limitations for 
more information. 


ot 是 浮 点 数 中 的 十 进 制 转化 为 二 进 制 惹 
"J 不 o 


除法 的 问题 似乎 要 到 此 结束 了 ， 其 实 远 远 没有 ， 不 过 ， 作 为 初学 着 ， 
至 此 即 可 。 


1.3 ”和 营 用 数学 芳 数 和 运算 优先 级 

在 数学 之 中 ， 除 了 加 减 乘除 四 则 运算 之 外 (这 是 小 学 数学 ) ， 还 有 其 
他 更 多 的 运算 ， 比 如 乘 方 、 开 方 、 对 数 运 算 等 ， 要 实现 这 些 运 算 ， 
要 用 到 Python 中 的 一 个 模块 : math。 

1.3.1 ”使 用 math 模 块 


math 模 块 是 Python 标 准 库 中 的 ， 所 以 不 用 安装 就 可 以 直接 使 用 。 使 用 


记 居 是 : 


强 凋 


>>> import math 


用 import 束 将 math 模 块 引用 过 来 了 ， 下 面 束 可 以 使 用 这 个 模块 提供 的 
工具 了 。 比 如 ， 要 得 到 圆周 率 : 


> math.pi 


3.141592653589793 


这 个 模块 都 能 做 哪些 事情 呢 ? 可 以 用 下 面 的 方法 看 到 : 


osh', 'asin', 'a tan’, al F ‘atanh’, 'ceil’, 

有 ', "exp'， 'expm1'， 'fabs', 'factorial', 'floor', 'fmod', 'frexp', 'fsu 

', 'gamma', 'hypot', 'isinf', 'isnan', 'ldexp', 'lgamma', 'l0g', 'l10g10', 'logip', 'modf', 'pi', 'pow', 'radians', 's 
‘sinh', rt', ! '] 


dir (module) 是 一 个 非常 有 用 的 指令 ， 可 以 通过 它 查 看 任何 模块 中 所 
包含 的 工具 。 从 上 面 的 列表 中 就 可 以 看 出 ， 在 math 模 块 中 ， 可 以 计算 
正弦 sin()、 余 弦 cos()、 开 平方 0sqrt() 等 贸 数 。 


这 些 画 数 是 math 中 提供 的 ， 不 需要 我 们 编写 ， 可 以 拿 过 来 整 用 。 比 如 
计算 乘 方 ， 可 以 使 用 pow 函 数 。 但 是 ， 直 么 用 呢 ? 


Python 是 一 个 非常 周到 的 * 姑 如”， 她 早 束 提 供 了 一 个 命令 ， 让 我 们 来 
查看 每 个 贸 数 的 使 用 方法 。 


>>> help(math .pow) 


在 交互 模式 下 输入 上 面 的 指令 ， 然 后 回 车 ， 看 到 下 面 的 信息 : 


Help on built-in function pow in module math: 


pow(...) 


Return x**y (x to the power of y). 


Us 楚 地 告诉 了 我 们 math 中 的 pow 函 数 的 使 用 方法 和 相关 说 
明 。 


由 于 是 第 一 次 用 到 heljp0， 有 必要 将 结果 详细 解释 一 番 。 


1) 第 一 行 意思 是 说 这 里 是 math 模 块 的 内 建 画 数 pow 的 帮助 信息 (built 
in 称 之 为 内 建 画 数 ， 是 说 这 个 画 数 是 python 默认 的 ) 。 


2) 第 三 行 表示 这 个 函数 的 参数 ， 有 两 个 ， 也 是 函数 的 调用 方式 。 


ee 
含义 。 


最 后 ， 按 q 键 返回 到 Python 交互 模 式 。 


当然 ， 也 看 到 了 一 个 额外 的 信息 ， 束 是 pow 函 数 和 x**y 是 等 效 的 ， 痢 
是 计算 x 的 y 次 方 。 


E,W 4 


16 
>>> math.pow(4,2) 


16.0 


特别 注意 ，4**2 和 4*2 是 有 很 大 区 别 的 。 


用 help0 函 数 ， 可 以 查看 math 模 块 中 任何 一 个 钞 数 的 使 用 方法 。 


下 面 是 几 个 浓 用 的 math 模 块 中 国 数 举例 ， 你 可 以 


比照 。 
> math.sqrt(9) 

> math.floor(3.14) 

> math.floor(3.92) 

> math.fabs(-2) # 等 价 于 abs(-2) 


> abs(-2) 


> math.fmod(5,3) ”# 等 价 于 5%3 


>»> 5 %3 


2 


在 上 面 的 内 容 中 ， 读 者 除了 要 了 人 解 math 模 块 外 ，3 


非常 有 帮助 的 内 建 国 数 dir0 和 help0 。 
1.3.2 ”两 个 函数 

下 面 两 个 也 是 常用 的 数学 函数 。 

1. 求 绝对 值 


>> abs(10) 
10 
>> abs(-10) 
10 


>> abs(-1.2) 


结合 自己 调试 的 进行 


>>> round(1.234) 
二 :站 


>>> round(1.234，2) 


如 有 果 不 清楚 这 个 函数 的 用 法 ， 可 以 使 用 下 面 的 方法 看 帮助 信息 。 


>>> help(round) 


Help on built-in function round in module _builtin 


round(...) 
round(number[, ndigits]) -> floating point number 
Round a number to a given precision in decimal digits (default 9 digits). 


This always returns a floating point number. Precision may be negative. 


1.3.3 ”运算 优先 级 


从 小 学 数学 开始 ， 束 研究 运算 优先 级 的 问题 ， 比 如 在 四 则 运算 中 “ 先 乘 
除 ， 后 加 减 *”， 说 明 乘 法 和 除法 的 优先 级 要 高 于 加 法 和 减法 。 对 于 同一 
级 别 的 ， 殊 按照 “从 左 到 右 ” 的 顺序 进行 计算 。 


下 面 的 表格 中 列 出 了 Python 中 的 各 种 运算 的 优先 级 顺序 。 不 过 ， 束 一 
般 情 况 而 言 ， 不 需要 记忆 ， 完 全 可 以 按照 数学 中 的 运算 规则 去 理解 ， 

因为 人 类 既然 已 经 发 明了 数学 ， 在 计算 机 中 进行 的 运算 就 不 需要 重新 
编写 一 套 新 规范 了 ， 只 需要 符合 数学 中 的 运算 规则 即 可 。 


在 此 读者 只 需要 看 个 大 概 、 有 个 印象 即 可 ， 可 以 一 边 辣 后 阅读 ， 一边 
回来 翻阅 ， 或 者 在 用 到 的 时 候 来 这 里 查看 。 如 表 1-1 所 示 。 


表 1-1 运算 规则 


Lambda 表达 式 
布尔 “或 ” 
布尔 “与 ” 
布尔 “ 非 ” 
成 员 测 试 

司 一 性 测试 


最 后 要 提 及 的 是 运算 中 的 绝 杀 ， 括 号。 只 要 有 括号 ， 束 先 计算 括号 里 
面 的 。 这 二 数学 中 的 共识 ， 无 需 解 释 。 


1.4 第 一 个 人 简单 的 程序 

通过 对 四 则 运算 的 学 习 ， 已 经 初步 接触 了 Python 中 的 内 容 ， 如 果 是 去 
基础 的 学 习 者 ， 可 能 会 有 点 迷惑 : 难道 敲 几 个 命令 ， 然 后 看 到 结果 ， 
就 算 编程 了 ? 这 也 不 是 那些 能 够 自动 运行 的 程序 啊 ? 


到 目前 为 止 ， 还 不 能 算 编程 ， 只 能 算 会 用 一 些 指令 (或 者 叫 作 命 令 ) 
来 做 点 儿 简 单 的 工作 。 


少 安 毋 躁 ， 下 面 承 开始 编写 一 个 真正 的 、 人 简单 的 程序 。 

1.4.1 程序 

下 面 一 段 内 容 是 关于 程序 的 概念 ， 内 容 来 目 维基 百科 : 

计算 机 程序 (Computer Program) 是 指 一 组 指示 计算 机 或 其 他 具有 信 
息 处 理 能 力 、 装 置 每 一 步 动 作 的 指令 ， 通 常用 某 种 程序 设计 语言 编 
号 ， 运行 于 某 种 目标 体系 结构 上 。 打 个 比方 ， 一 个 程序 就 像 一 个 用 汉 


语 (程序 设计 语言 ) 写 下 的 红烧 肉 莱 谱 (程序 ，， 用 于 指导 懂 汉 语 和 
京 饪 手法 的 人 (体系 结构 ) 来 做 这 个 菜 。 


通常 ， 计 算 机 程序 要 经 过 编译 和 链接 而 成 为 一 种 人 们 不 易 看 清 而 计算 
机 可 解读 的 格式 ， 然 后 运行 。 未 经 编译 束 可 运行 的 程序 ， 通 常 称 之 为 
脚本 程序 (script) 。 


简 而 言 之 ， 程 序 殉 是 指令 的 集合 。 但 是 ， 有 的 程序 需要 编译 ， 有 的 不 
需要 。Python 编 写 的 程序 束 不 需要 编译 ， 因 此 她 也 被 称 之 为 解释 性 语 
言 ， 编 程 出 来 的 程序 叫 作 脚 本 程序 。 


某 些 程序 员 认 为 “编译 型 语言 比 解释 性 语言 高 价 ”， 这 是 错 旋 的 。 
认为 编译 的 程序 好 ， 不 编译 的 束 不 好 ; 也 不 要 认为 编译 的 程序 属于 “高 
疹 ”， 不 编译 的 吏 属 于 “ 低 端 >， 这 是 训 无 根据 的 。 

不 争论 ， 用 得 妙 束 是 好 。 

1.4.2 ”用 IDE 编 程 


在 实践 中 ， 每 个 人 都 有 自己 喜欢 的 IDE。 所 以 ， 也 请 读者 在 学 习 中 找 
到 上 自己 喜欢 的 IDE， 


Python 有 一 个 默认 IDE， 当 打开 了 Python Shell 之 后 ， 通 过 “File->New 
1 °。 如 图 1-2 所 示 。 在 这 个 界面 中 就 可 以 
号 种 序 了 。 


在 这 个 界面 看 不 到 用 于 输入 指令 的 提示 符 “>>>”， 这 个 界面 有 点 像 记 
事 本 。 说 对 了 ， 其 本 质 上 就 是 一 个 记事 本 ， 只 能 输入 文本 ， 不 能 直接 
在 里 面 贴图 片 。 如 图 1-3 所 示 。 


r 11 2012, 07:15:24) [MSC v.1500 32 bit ( <| 


New Window CtrizN 

Open... CtrizO s" or "license{()" for more information,. 
Recent Files 

Open Module... 

Class Browser 

Path Browser e 1, in <module> 


Save s not defined 
Save As... Ctrl+ Shift+S 
. Alt+Shift+S 


和 


Ctri+p Ln:7|Cok:0 


Alt+F4 
Ctri+Q 


图 1-2 ”文本 编辑 界 下 


Eile Edit Debug Options Windows Help 


*Untitled* 


| File Edit Format Run Options Windows Help 


| 这 本 后 上 新 是 记 吉本 | 
可 以 输入 文字 
可 以 换行 
还 可 以 ....| 


图 1-3 ”输入 界 画 


1.4.3 Hello, World 


“Hello，World” 是 面 癌 世界 的 标志 ， 所 以 ， 任 何 程序 的 第 一 名 一定 要 
写 这 个 ， 因 为 程序 员 是 面 癌 世界 的 ， 绝 对 不 且 缩 在 某 个 局 域 网 内 。 


直接 上 代码 ， 丈 这 么 一 行 即 可 。 


print "Hello,World" 


如 图 1-4 所 示 为 代码 样式 。 


程序 束 古 指令 的 集合 。 现 在 ， 这 个 程序 里 面 束 一 条 指令 ， 一 条 指令 也 
可 以 成 为 集合 。 


注意 观察 ， 单 击 Run 菜 单 ， 在 下 拉 列 表 里 面 选择 “Run Module”， 如 图 1- 
5 所 示 。 


File Edit Format Run Options Windows Help 


N17 T | 四 
:4 | 


图 1-4 ”代码 样式 


File Edit Format Run Options Windows Help 


Python Shell 


Check Module Alt+X 
Run Module FS 


然后 弹出 对 话 框 ， 要 求 把 这 个 文件 保存 ， 将 文件 保存 到 一 个 位 置 ， 一 
定 要 记 住 这 个 位 置 ， 并 且 取 个 文件 名 ， 文 件 名 以 .py 为 扩展 名 。 


都 做 好 之 后 ， 单 击 “ 确 定 ” 按 钮 ， 就 会 发 现在 另外 一 个 带 有 “>>>” 的 界面 
中 ， 就 自动 出 来 了 “Hello，World” 两 个 大 字 。 


成 功 了 吗 ? 成 功 了 也 别 兴 奋 ， 因 为 还 没有 到 庆祝 的 时 候 。 


在 这 种 情况 下 ， 我 们 依然 是 在 IDE 的 环境 中 实现 了 刚才 那 段 程序 的 目 
动 执 行 ， 如 采 脱 离 这 个 环境 呢 ? 


关闭 IDLE， 打 开 shell， 或 者 打开 cmd， 通 过 命令 的 方式 ， 进 入 到 你 刚 
才 保 存 的 文件 目录 。 


qwGqw-Latitude-E4300:~/Documents/ITArticLes/BasicPythony/codes5 ls 
165.py 


qw@qw-Latitude-E4300:~/Documents/ITArticles/Basicpython/codes$ 


ee 名 为 105.py， 束 是 刚才 保存 的 那个 文 


然后 在 这 个 shell 里面 输入 : python 105.py。 


上 面 这 句 话 的 含义 束 是 : 告诉 计算 机 运行 一 个 Python 语言 编写 的 程 
序 ， 程 序 文件 的 名 称 是 105.py 


我 的 计算 机 我 做 主 ， 于 是 筷 乖 弄 地 执行 了 这 条 命令 。 如 下 图 : 


qwGqw-Latitude-E4300:~/Documents/ITArticLes/BasicPythony/codes5 ls 
1695 .py 


qw@qw-Latitude-E4300:~/Documents/ITArticles/Basicpython/codes$ python 165.py 
Hello ,Wworld 
qw@qw-Latitude-E43060:~/Documents/ITArticles/BasicPpython/codes$ 


还 在 沉默 ? 可 以 欢呼 了 。 因 为 你 在 程序 员 道路 上 迈 出 了 伟大 的 第 二 步 
(思考 :什么 时 候 迈 出 的 第 一 步 ? ) 。 


1.4.4 解 一 道 题目 


题目 : 请 计算 19+2*48/2 


读者 先 自己 仰望 天 空 (或 者 天 花 板 ) 宪 想 一 下 大 概 如 何 写 ， 然 后 继 


代码 : 


#!/usr/bin/env python 


#coding:utf-8 


请 计算 : 19+2*48/2 


a=19+2*4-8/2 


print a 


提 桓 初学 者 ， 不 要 复制 这 段 代码 ， 要 一 个 字 一 个 字 地 殴 进 去 ， 然 后 保 
存 (我 保存 的 文件 名 是 : 105-1.py) 


在 shell 或 者 cmd 中 ， 执 行 : python 文 件 名 .py。 
执行 结果 如 下 图 : 


qw@qw-Latitude-E4300:~/Documents/ITArticles/Basicpython/codes$ python 165-1.py 
23 


好 像 还 是 比较 简单 。 
下 面 对 这 个 简单 程序 进行 解释 。 


#!/usr/bin/env python 


这 一 行 是 必须 写 的 ， 它 能 够 引导 程序 找到 Python 的 解释 器 (或 者 叫 解 
析 器 、 直 译 器 ) 。 也 就 是 说 ， 不 管 这 个 文件 保存 在 什么 地 方 ， 这 个 程 
序 都 能 执行 ， 而 不 用 指定 Python 的 安装 路 径 。 


解释 器 (Interpreter) ， 是 一 种 电脑 程序 ， 能 够 把 高 级 编程 语言 逐 行 直 
接 翻 译 运 行 。 解 释 砷 不 会 一 次 性 把 整个 程序 翻译 出 来 ， 只 像 一 位 “中 间 
人 ”， 每 次 运行 程序 时 都 要 先 转 成 男 一 种 语言 再 运行 ， 因 此 解释 器 的 程 


序 运 行 速 度 比 较 缓慢 。 它 每 翻译 一 行程 序 语句 束 立 刻 运 行 ， 然 后 再 翻 
译 下 一 行 ， 再 运行 ， 如 此 不 停 地 进行 下 去 。 


解释 器 的 好 人 处 是 它 消 除了 编译 整个 程序 的 负担 ， 但 也 会 让 运行 时 的 效 
率 打 折扣 。 相 对 地 ， 编 译 器 并 不 运行 程序 或 源 代码 ， 而 是 一 次 将 其 翻 
译 成 男 一 种 语言 ， 如 机 妖 码 ， 以 供 多 次 运行 而 无 须 再 编译 。 其 制 成 品 
I 程序 运行 速度 比较 快 。 (来 自 《维基 百 


#coding:utf-8 


一 行 是 告诉 Python， 本 程序 采用 的 编码 格式 是 utf-8， 什 么 是 
什么 是 Wtf 8 这 是 个 比较 复杂 朋 有 历史 的 问题 此 处 暂 不 讨论 。 
有 有 了 上 面 这 人 句 话 ， 在 后 面 的 程序 中 才能 写 汉字 ， 否 则 就 会 报错 。 


这 一 行 是 让 人 看 的 ， 而 计算 机 看 不 懂 。 在 Python 程序 中 ( 别 的 编程 语 
言 也 是 如 此 ) ， 要 写 所 谓 的 注释 ， 就 是 对 程序 或 者 某 段 语句 的 说 明文 
字 ， 这 些 文字 在 计算 机 执行 程序 的 时 候 被 计算 机 姑娘 忽略 ， 但 是 ， 必 
要 的 注释 又 是 必 不 可 少 的 ， 正 如 前 面 说 的 那样 ， 程 序 在 大 多 数 情 况 下 
古 给 和 人 看 的 ， 注 释 谍 古 帮 助人 理解 程序 的 。 当 然 ， 本 程序 中 的 注释 是 
不 必要 的 ， 纯 粹 是 为 了 说 明 注 释 而 写 。 


写 注释 的 方式 有 两 种 ， 一 种 是 单行 注释 ， 用 “#? 开 涉 ， 男 一 种 是 多 行 注 
释 ， 用 一 对 “"” (三 个 单 引 号 ) 包 衷 起 来。 


用 # 开 头 的 注释 ， 可 以 像 下 面 这 样 来 写 : 


这 种 注释 通常 写 在 程序 中 的 某 个 位 置 ， 比 如 某 个 语句 的 前 面 或 者 后 
面 。 计 算 机 也 会 忽略 这 种 注释 的 内 容 ， 因 为 只 是 给 人 看 的 。 


一 般 在 程序 的 开头 部 分 都 要 写 点 东西 ， 主 要 是 告诉 别人 这 个 程序 是 用 
nn 


*4-8/2 


所 谓语 句 ， 就 是 告诉 程序 要 做 什么 事情 。 程 序 是 由 各 种 各 样 的 语句 组 
成 的 。 这 条 语句 还 有 一 个 名 字 ， 叫 作 赋 值 语 句 。19+2*48/2 是 一 个 表达 
式 ， 最 后 要 计算 出 一 个 结果 ， 这 个 结果 就 是 一 个 对 象 。 


“=”， 不 要 理解 为 数学 中 的 等 号 ， 它 的 作用 不 是 “等 于 "， 而 是 完成 赋值 
语句 中 “赋值 "的 功能 。a 是 变量 。 这 样 就 完成 了 一 个 赋值 过 程 。 


语句 和 表达 式 的 区 别 : “表达 式 台 是 某 件 事 ”, “语句 是 做 某 件 事 ”。 


print a 


这 还 是 一 个 语句 ， 称 之 为 print 语 名 ， 残 是 要 打印 出 a 的 值 (这 种 说 法 不 
征 非常 产 格 ， 但 是 通常 都 这 么 说 。 严 格 的 说 法 是 打印 变量 a 做 对 应 的 对 
象 的 值 。 但 这 种 说 法 哆 哄 ， 就 直接 说 打印 的 值 。 


是 不 是 在 为 看 到 自己 写 的 第 一 个 程序 而 欣慰 呢 ? 
1.5 ”字符 操 


如 有 果 要 对 目 然 语言 分 类 ， 则 和 常见 的 是 英语 、 法 语 、 汉 语 等 ， 语 言 学 专 
家 还 会 把 他 们 归 类 为 什么 语系 。 我 虽然 不 是 语言 学 专家 ， 但 是 也 做 了 
一 反目 己 的 思考 ， 虽 然 尚 未 得 到 广大 人 民 群 众 和 人 研究 者 的 广泛 认同 ， 
但 是 ， 我 相信 那 名 “真理 是 掌握 在 少数 人 手 里 的 ”， 至 少 在 这 里 可 以 用 
来 给 目 己 壮 壮胆 。 


我 对 语言 的 分 类 方法 是 : 


。 类 别 一 : 语言 中 的 两 个 元 素 (比如 两 个 字 ) 拼接 在 一 起 ， 出 来 一 
人 
， 子 O 

。 类 别 二: 两 个 元 素 连 接 在 一 起 (与 “拼接 ”有 差别 ) ， 也 就 是 这 两 
个 元 素 并 列 显示 。 比 如 “好 ”和 “人 ”， 两 个 元 素 连 接 在 一 起 是 “好 
人 ”。 而 3 和 5 拼接 〈 就 是 整数 求 和 ) 在 一 起 是 8 (属于 第 一 类 ) ， 
如 果 连 接 ， 束 是 35， 那 惑 属 于 第 二 类 了 。 


上 述 分 类 方法 也 适用 于 英文 ， 征 否 适 用 于 其 他 语种 还 有 待 验证 。 


把 我 的 这 种 分 法 抽象 一 下 (因为 有 这 种 简单 的 抽象 ， 才 显示 出 上 述 语 
言 的 分 类 方法 高 于 一 般 的 语言 学 专家 所 认同 的 方法 ) : 


。 类 别 一 是 ，A+ro 
。 类 别 二 是 ，A+D=AD 


根据 我 个 人 的 研究 ， 在 目前 知晓 的 语言 范畴 中 ， 都 没有 离开 以 上 两 种 
分 类 ， 不 是 第 一 类 就 是 第 二 类 。 


1.5.1 字符 串 


在 我 洋 详 目 得 的 时 候 ， 我 搜索 了 一 下 ， 才 发 现 目 己 没 那 么 高 明 ， 维 基 
百科 的 “字符 串 ” 词 条 是 这 么 说 的 : 


字符 串 (String) ， 是 由 零 个 或 多 个 字符 组 成 的 有 限 串 行 。 一 般 记 为 
s=a[llla[l21...aln] ° 


看 到 维基 百科 的 伟大 了 吧 ， 它 已 经 把 我 所 设想 的 那 种 情况 取 了 一 个 形 
象 的 名 称 ， 叫 作 字 符 串 ， 其 本 质 上 束 是 一 串 字 符 。 


根据 这 个 定义 ， 前 面 两 次 计 一 个 程序 员 感 到 伟大 的 “Hello，World" 瓯 
征 一 个 字符 串 。 或 者 说 不 管 是 用 英文 还 是 中 文 还 是 别 的 某 种 文 ， 写 出 
来 的 文字 都 可 以 作为 字符 串 对 待 ， 当 然 ， 里 面 的 特殊 符号 ， 也 可 以 作 
为 字符 串 ， 比 如 空格 等 。 


在 Python 中，“ 万 物 首 对 象 "， 显 然 “Hello，World” 就 是 一 个 对 象 ， 这 个 
对 象 是 一 个 字符 串 ， 也 就 是 说 ， 字 符 串 是 对 象 类 型 ， 用 str 表 示 ， 这 就 
如 同 前 面 遇 到 的 int 类 型 一 样 。 字 符 串 类 型 的 对 象 通常 用 单 引号 或 者 双 
引号 包 庄 起 来 。 


>>> "I love Python." 


'I love Python.' 
>>> 'I LOVE PYTHON.' 


'I LOVE PYTHON.' 


人 


>>> 250 


250 


>>> type(250) 


<type 'int'> 


>>> type("250") 


<type 'str'> 


在 这 个 例子 中 同样 是 250， 但 区 别 很 大 。 一 个 没有 放 在 引号 里 面 ， 一 个 
放 在 了 引号 里 面 ， 用 typeO) 玉 数 来 检验 一 下 ， 发 现 它们 居然 是 两 种 不 同 
的 对 象 类 型 ， 前 者 是 int 类 型 ， 后 者 则 是 st 类 型 ， 即 字符 串 类 型 。 所 
以 ， 请 大 家 务必 注意 ， 不 是 所 有 数字 都 是 int (或 者 float) 类 型 ， 如 果 
它 在 引号 里 面 ， 就 是 字符 串 了 。 如 果 搞 不 清楚 是 什么 类 型 的 话 ， 就 让 
typeO 来 帮忙 搞定 。 


操练 起 来 : 


>>> print "good good study, day day up" 


good good study, day day up 
>>> print "----good---study---day----up" 


----good---study---day----up 


在 print 后 面 打 印 的 都 是 字符 串 。 注 意 ， 引 号 不 是 字符 串 的 组 成 部 分 ， 
而 是 在 告诉 计算 机 里 面包 庄 着 的 是 一 个 字符 串 。 如 果 使 用 Python 3.x， 
应 该 使 用 print0 函 数 ， 在 Python 3.x 中 ， 类 似 的 效果 由 printO0 落 数 完 成 。 


爱 思 考 的 读者 肯定 想到 一 个 问题 ， 如 果 要 把 下 面 这 人 句 话 看 作 一 个 字符 
串 应 该 起 么 做 ? 


What's your name? 
这 人 句 话 中 有 一 个 单 引 和 号 ， 如 来 在 交互 模式 中 像 上 面 那 样 直接 输入 ， 整 
会 这 样 : 
>>> 'What's your name?， 
File "<stdin>", line 1 
'What's your name? 
SyntaxError: invalid syntax 


出 现 了 SyntaxError (语法 错误 ) 引导 的 提示 ， 这 是 在 告诉 我 们 这 里 存 
在 错误 ， 错 误 的 类 型 就 是 SyntaxError， 后 面 是 对 这 种 错误 的 解 


释 “invalid syntax” (无 效 的 语法 ) 。 特 别 注意 ， 错误 提示 的 上 面 ， 有 一 
个 “ 心 符 号 ， 指 着 一 个 单 引 号 ， 是 在 告诉 我 们 这 里 出 现 错误 了 。 


在 Python 中 ， 这 一 点 是 非常 友好 的 ， 如 有 果 语 句 存在 错误 ， 吏 会 将 错误 
输出 来 ， 供 程序 员 参 考 。 当 然 ， 有 时 候 错 误 来 源 比 较 复杂 ， 需 要 根据 
经 答 和 知识 进行 修改 。 还 有 一 种 修改 错误 的 好 办 法 ， 束 古 将 错误 提示 
放 到 Google 中 进行 搜索 。 


上 面 那个 值 的 错误 原因 是 什么 呢 ? 仔细 观察 ， 发 现在 那 句 话 中 事实 上 
有 三 个 单 引号 ， 本 来 一 对 单 引 号 之 间 包 奏 的 是 一 个 字符 串 ， 现 在 出 现 
了 三 个 单 引号 ，Computer 娃 女 迷 藻 了， 她 不 知道 单 引号 包 夺 的 到 友 是 
谁 ， 于 是 报错 。 

解决 方法 一 : 双 引 号 包 圳 单 引号 


>>> "What's your name?" 


"What 's your name?" 


双 引 号 里 面 允 许 出 现 单 引号 ， 反 过 来 ， 单 引号 里 面 也 可 以 包 右 双 引 
号 ， 这 个 可 以 党 统 地 称 为 二 者 的 稚 套 。 

解决 方法 二 : 使 用 转 义 符 

所 谓 转 义 ， 束 是 让 某 个 符号 不 再 表示 某 种 合 义 ， 而 十 表示 为 外 一 种 含 
义 。 转 义 符 的 作用 就 古 它 能 够 转变 符号 的 含义 。 在 Python 中 ， 
I 


征 不 是 看 到 转 义 符 的 作用 了 ? 


本 来 单 引 号 不 是 字符 这 的 一 部 分 ， 但 是 如 有 宁 前 面 有 转 义 待 ， 那 么 它 束 
0 


SS 
人 


1.5.2 ”变量 和 字符 串 


大 家 对 于 “变量 ”已 经 不 卫生 了 吧 ， 这 里 是 第 二 次 出 现 了 ,“ 一 回 生 二 回 
询 ”。 一 条 金 科 玉 律 是 :在 Python 中 “变量 无 类 型 ,对象 有 类 型 "。 变量 
相当 于 一 个 标签 ， 贴 在 了 不 同 的 对 象 上 。 这 种 “ 贴 ? 的 动作 ， 可 以 通过 
复制 语句 完成 。 


同样 ， 对 字符 种 类 型 的 对 象 也 是 这 样 ， 能 够 通过 赋值 语句， 将 对 象 与 
某 个 标签 《变量 ) 关联 起 来 。 


>>> b = "hello,world" 
>>> b 

'hello, world' 

>>> print b 


hello,world 


依然 请 出 typeO 函 数 ， 得 到 变量 类 型 . 


>>> type(b) 


<type 'str'> 


1,5,3 连接 字 竺 蛙 


把 两 个 数字 用 “+ 符号 连接 起 来 ， 比 如 3+5， 结 采 为 8， 这 其 实 是 求 和 。 
但 是 ， 对 了 字符 串 进 行 类 似 操 作 呢 ?是 这 样 的 : 


"python' 


两 个 字符 串 “ 相 加 ”， 束 相当 于 把 两 个 字符 串 连 接 起 来 。 别 的 运算 束 别 
兰 试 了 ,没什么 意义 ， 肯 定 报错 ， 不 信 束 试 试 : 


>>>"py"-"thon" # 我 这 么 做 ， 是 不 是 脑袋 进 水 泥 了 ? 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: unsupported operand type(s) for -: 'str' and 'str' 


用 “+” 号 实现 连接 的 确 比较 简单 ， 不 过 ， 有 时 候 你 会 遇 到 这 样 的 问题 : 


>>> a = 1989 
>>> b = "free" 


>>> print b + a 


报错 了 ， 其 错误 原因 已 经 打印 出 来 了 《一定 要 注意 看 打印 出 来 的 信 
已， 这 是 解决 问题 的 入 口 ) : cannot concatenate'strand'intobjects。 原 
来 a 对 应 的 对 象 是 一 个 int 类 型 的 ， 不 能 将 它 和 str 类 型 的 对 象 连 接 起 来 。 
MR 

用 “+” 拼 接 起 来 的 两 个 对 象 必须 是 同一 种 类 型 的 。 如 果 两 个 都 是 数字 ， 
ee 瓯 是 求 和 ; 如 果 都 是 字符 串 ， 那 么 区 得 到 一 个 新 
J 字符 串 。 


修改 上 面 的 错误 ， 可 以 通过 以 下 方法 : 


>>> print b + “a. 


你 古 不 是 照 大 上 面 融 过 代码 呢 ? 你 的 结果 有 没有 报错 ? 

注意 : “是 反 引 号 ， 不 是 单 引 号， 束 是 键盘 中 通常 在 数字 1 左边 的 那个 
键 ， 在 英文 半角 状态 下 输入 的 符号 。 这 种 方法 ， 在 编程 实践 中 较 少 应 
用 ， 竺 别 是 在 Python 3 中 ， 已 经 把 这 种 方式 痉 绝 了 。 我 想 原 因 驶 是 这 

个 符号 太 容 易 和 单 引 号 混 清 了 ， 且 在 编程 中 也 不 容易 看 出 来 ， 可 读 性 


差 


常言 道 :“ 困 难 只 有 一 个 ， 但 解决 困难 的 方法 不 止 一 种 ”， 既然 反 引 号 
的 可 读 性 不 好 ， 在 编程 实践 中 束 尽 量 不 要 使 用 。 于 是 平 束 有 了 下 面 的 
0 这 是 被 广泛 采用 的 。 不 仅 位 单 ， 更 主要 的 十 直 日 ， 让 人 一 看 谍 
和 恒 oO 


>>> print b + str(a) 


free1989 


用 str (a) 实现 将 整数 对 象 转换 为 字符 串 对 象 。 虽 然 str 是 一 种 对 象 类 
型 ， 但 是 它 也 能 够 实现 对 象 类 型 的 转换 ， 这 吏 起 到 了 一 个 函数 的 作 
用 。 其 实 前 面 已 经 讲 过 的 int 也 有 类 似 的 作用 ， 比 如 : 


>> a = "250" 


>>> type(a) 


<type 'str'> 


>>> type(b) 


<type 'int'> 


如 果 你 对 int 和 str 比 较 好 奇 ， 可 以 在 交互 模式 中 使 用 help (int) ， 学 习 
help (str) 可 以 查阅 相关 的 其 他 资料 。 


看 本 书 的 时 候 ， 一 定 要 同时 打开 计算 机 ， 一 边 看 一 边 操 作 才 不 睡觉 ， 
尽管 本 书 充满 了 “水 分 ”， 让 你 难以 入 睡 ， 但 是 这 种 不 是 小 说 的 书籍 ， 
总 是 在 催眠 上 有 很 好 疗效 的 。 


还 有 第 三 种 : 


>>> print b + repr(a)  #repr(a) 与 上 面 的 类 似 


free1989 


这 里 repr0) 是 一 个 画 数 ， 其 实 就 是 反 引 号 的 替代 品 ， 它 能 够 把 结果 字符 
串 转化 为 合法 的 Python 表达 式 。 


可 能 读者 这 时 候 心 存疑 惑 ， 它 们 三 者 之 间 有 区 别 吗 ? 首先 明确 ，repr() 
和 是 一 致 的 ， 束 不 用 区 别 了 。 接 下 来 需要 区 别 的 就 是 repr() 和 str， 一 
个 最 简单 的 区 别 : repr 是 函数 ，str 跟 int 一 样 是 一 种 对 象 类 型 。 不 过 ， 
仅 这 么 说 是 不 能 完全 解 惑 的 ， 举 亏 有 Google 让 我 府 使 用 ， 你 会 找到 很 
多 人 对 这 两 者 进行 区 分 的 内 容 ， 我 推荐 以 下 这 些 : 


1.When should i use str()and when should i use reprO? 
Almost always use str when creating output for end users. 


repr is mainly useful for debugging and exploring.For example, if you 
suspect a string has non printing characters in it, ora float has a small 
rounding error, repr will show you;str may not. 


repr can also be useful for for generating literals to paste into your source 
code.It can also be used for persistence (with ast.literal_eval or eval) ， 
but this is rarely a good idea--if you want editable persisted values, 
something like JSON or YAML is much better, and if you don't plan to 
edit them, use pickle. 


2.In which cases i can use either of them? 


Well, you can use them almost anywhere.You shouldn't generally use them 
except as described above. 


3.What can str()do which repr()can't? 


Give you output fit for end-user consumption--not always (e.g., str 
(['spam', ‘eggs']) isn't likely to be anything you want to put in a 
GUI , butmore often than repr. 


4.What can repr()do which str()can't 


Give you output that's useful for debugging--again, not always (the 


default for instances of user-created classes is rarely helpful) ，Pbnut 
whenever possible. 


And sometimes give you output that's a valid Python literal or other 
expression--but you rarely want to rely on that except for interactive 
exploration. 


以 上 英文 内 容 来 源 : 


http://stackoverflow.com/questions/19331404/str-vs-repr-functions-in- 
python-2-7-5 ° 


1.5.4 ” 转 义 字符 
在 字符 串 中 ， 有 时 需要 输入 一 些 特殊 的 符号 ， 但 是 ， 某 些 符 号 不 能 


接 和 输出 ， 束 需要 用 转 义 符 。 所 谓 转 义 ， 束 是 不 采用 符号 本 来 的 含义 ， 
而 采用 另外 一 种 含义 。 下 面 列 出 常用 的 转 义 符 ， 如 表 1-2 所 示 。 


表 1-2 常用 的 转 义 符 


(在 行 尾 时 ) 续 行 符 
反 斜 杠 符号 


单 引号 


双 引 号 


响 铃 


退 格 (Backspace) 
转 义 


换行 

纵向 制 表 符 

横向 制 表 符 

回 车 

换 页 

八进制 数 ，yy 代表 的 字符 ， 例 如 : \o12 代表 换行 
六 进 制 数 ，yy 代表 的 字符 ， 例 如 : \x0a 代表 换行 
其 他 的 字符 以 普通 格式 输出 


以 上 所 有 转 义 符 ， 都 可 以 通过 交互 模式 下 print 来 测试 一 下 ， 感 受 实际 
上 是 什么 样子 的 。 例 如 : 


>>> print "hello.I am qiwsir.\ # 这 里 换行 ， 下 一 行 接续 


.. My website is 'http://qiwsir.github.io'." 
hello.I am qiwsir.My website is 'http://qiwsir.github.io'. 
>>> print "you can connect me by qq\\weibo\\gmail" #\\ 是 为 了 要 后 面 那个 \ 


you can connect me by qq\weibo\gmail 


总 要 上 自己 多 练习 ， 才 能 充分 理解 转 义 符 的 作用 。 
1.5.5 ”原始 字符 串 


用 转 义 符 能 够 让 字符 串 中 的 某 些 符号 表示 原来 的 售 义 ， 而 不 是 说 解 析 
成 某 种 具有 特别 能 力 的 符号 。 为 了 说 话 简单 ， 我 们 常常 把 那 种 每 个 字 
符 都 是 原始 含义 的 字符 串 说 成 原始 字符 串 ， 比 如 反 和 斜 杜 ， 其 不 会 被 看 
作 转 义 符 ， 束 是 一 个 反 斜 杠 。 


>>> print "I like \npython" 
I like 


python 


这 里 的 反 斜 杠 束 不 是 “有 反 和 斜 杠 ” 的 原始 符号 含义 ， 而 是 和 后 面 的 n 一 起 表 
示 换 行 ( 转 义 了 ) 。 当 然 ， 这 似乎 没有 什么 太 大 影响 ， 但 有 了 时 候 可 能 
会 出 现 问题 ， 比 如 打印 DOS 路 径 。 


'C:\news! # 这 里 摇 似 没有 什么 问题 


>>> print dos # 当 用 print 来 打印 这 个 字符 串 的 时 候 就 出 问题 了 。 


如 何 避 免 ? 用 前 面 讲 过 的 转 义 符 可 以 解决 ， 读 者 试 一 下 。 


我 当然 束 不 能 再 用 转 义 符 了 ， 要 不 然 束 真 的 “ 太 水 ”了 。 我 用 下 面 的 方 
法 : 


c:\news\python 


状 如 r"c:mews"， 由 r 开 头 引 起 的 字符 串 就 是 声明 了 后 面 引 号 里 的 东西 
是 原始 字符 串 ， 在 里 面 放 任何 字符 都 表示 该 字符 的 原始 售 义 。 


这 种 方法 在 做 网 站 设置 和 网 站 目录 结构 的 时 候 非 常 有 用， 使 用 了 原始 
字符 串 束 不 需要 转 义 了 。 


1.5.6 raw_input 和 print 

小 孩 学 说 话 是 一 个 模仿 的 过 程 ， 周 围 的 人 说 什么 ， 孩 子 就 重复 什么 。 
如 果 你 已 经 忘记 自己 当初 是 怎么 学 说 话 的 了 ， 那 么 就 找 个 小 孩子 观察 
一 下 吧 ， 最 好 是 观察 自己 的 孩子 ， 如 果 没 有 ， 就 要 抓紧 了 。 

我 想 用 Python 实现 类 似 的 功能 。 


在 写 这 个 功能 前 ， 要 了 解 两 个 函数 : raw_input 《如果 是 使 用 Python 
3.x， 请 转换 为 Input()) 和 print。 


这 两 个 都 是 Python 的 内 建 函 数 (built-in function) 。 关 于 Python 的 内 建 
函数 ， 下 面 都 列 出 来 了 ， 供 参考 。 


abs() 、 divmod() 、 input() ~ open() 、 staticmethod() 、 all() 、 enumerate()、 
int() 、 ord() 、 str() ~、 any() ~ eval() ~、 isinstance() ~、 pow() 、 sum() 、 
basestring() 、 exectfile() 、 issubclass() 、 print() 、 super() 、 bin() 、 fileO、 


iter() ~ property() 、 tuple() ~ bool() 、 filter() ~、 len() 、 range() 、 type0O 、 
bytearray() 、 float() 、 list() ~ raw_input() ~ unichr() 、 callable() 、 
format() ~ locals() 、 reduce() ~ unicode() 、 chr() 、 frozenset() 、 long() 、 
reload() 、 vars() ~ classmethod() 、 getattr() 、 map() 、 repr() 、 xrange()、 
cmp() 、 globals() 、 max() 、 reversed() 、 zip() ~ compile() 、 hasattr()、 
memoryview() 、 round() ~、 import() 、 complex() 、 hash() 、 min() 、set()、 
apply() 、 delattr() 、 help() 、 next() 、 setattr() ~ buffer() 、 dict() 、 hex() 、 
object() 、 slice() ~ coerce() 、 dir() 、 id() 、 oct() 、 sorted() 、 intern()° 


这 些 内 建 钞 数 ， 怎 么 才能 知道 哪个 函数 怎么 用 ， 且 是 干什么 用 的 呢 ? 


曾 记 否 ? 前 面 使 用 过 的 方法 在 这 里 再 演示 一 人 壳 ， 这 种 方法 是 
python 的 于 哇 = 


>>> help(raw_input) 


然后 就 出 现 : 


Help on built-in function raw_input in module builtin 
raw_input(...) 


raw_input([prompt]) -> string 
Read a string from standard input. The trailing newline is stripped. 
If the user hits EOF (Unix: Ctl-D, Windows: Ctl-Z+Return), raise EOFError. 


On Unix, GNU readline is used if enabled. The prompt string, if given 


is printed without a trailing newline before reading. 


是 不 是 已 经 清晰 地 看 到 了 raw_inputO 的 使 用 方法 了 ? 


还 有 第 二 种 方法 ， 那 就 是 到 Python 的 官方 网 站 ， 碍 看 内 建 酚 数 的 说 
明 ， 网 址 : https://docs.python.org/2/library/functions.html ° 


其 实 ， 上 面 列 出 内 建 画 数 名 称 ， 束 是 在 这 个 网 页 中 抄 过 来 的 。 如 采 读 
者 愿意 跨越 发 展 ， 束 应 当 用 上 面 的 方法 把 每 个 内 建 图 数 怎么 使 用 、 返 
回 值 是 什么 等 都 查看 一 壳 ， 做 到 心中 有 数 。 


进入 交互 模式 ， 操 练 一 番 : 


>>> raw_input("input your name:") 


input your name:python 


'python' 


人 返回 了 输入 的 内 容 ， 用 一 个 变量 可 以 获得 这 个 返 


>>> name = raw_input("input your name:") 
input your name:python 

>>> name 

'python' 

>>> type(name) 


<type 'str'> 


而 且 ， 返 回 的 结果 是 str 类 型 。 如 采 输 入 的 是 数字 呢 ? 


>>> age = raw_input("How old are you?") 
How old are you?10 

>>> age 

110! 

>>> type(age) 


<type 'str'> 


返回 的 结 采 仍然 是 str 类 型 。 
再 试 试 print (大 不 晓得 起 么 用 ， 可 以 用 help0O 去 看 看 ) 。 


>>> print "hello, world" 
hello, world 

>>> a = "python" 

>>> b = "good" 

>>> print a 

python 

>>> print a,b 


python good 


比较 位 单 吧 。 


要 特别 提醒 的 是 ，print 的 返回 值 默认 是 以 \n 结 尾 的 ， 所 以 ， 每 个 输出 


语句 之 后 自动 换行 。 
有 了 以 上 两 个 准备 ， 接 下 来 就 可 以 写 一 个 能 够 “对 话 ” 的 小 程序 了 


#!/usr/bin/env python 


# coding=utf-8 


name = raw_input("Wwhat is your name?") 


age = raw_input("How old are you?") 


after_ten = int(age) + 10 


print "You will be " + Str(after_ten) + " years old after ten years." 
对 这 段 小 程序 有 一 些 说 明 。 


前 面 演示 了 print 的 使 用 ， 除 了 打印 一 个 字符 串 之 外 ， 还 可 以 打印 字符 
申 拼 授 结 果 。 


注意 ， 变 量 age 必 须 是 子 符 串 ， 如 最 后 的 那个 语句 中 : 


print "You will be " + str(after_ten) + " years old after ten years." 


这 人 句 话 里 面 有 一 个 类 型 转化 ， 将 原本 是 整数 型 after_ten 转 化 为 了 str 类 
型 ， 否 则 就 会 报错 。 


同样 注意 ， 在 after_ten=int (age) +10 中 ， 通 过 raw_input 得 到 的 是 str 类 
型 ， 当 age 和 10 求 和 的 时 候 ， 需 要 先 用 intO0 函 数 进行 类 型 转化 ， 才 能 和 
后 面 的 整数 10 相 加 。 


这 个 小 程序 基本 上 把 已 经 学 到 的 东西 综合 运用 了 一 次 。 请 读者 目 行 调 
Ee 如 果 没 有 通过 ， 则 仔细 看 报错 信息 ， 你 能 够 从 中 获得 修改 方 


1.5.7 索引 和 切片 


字符 申 是 一 个 话题 中 心 ， 在 某 些 朋友 的 程序 员 生 涯 中 ， 处 理 字符 串 的 
机 会 可 能 远 远 高 于 处 理 数 字 的 机 会 。 这 可 能 是 因为 现在 的 “程序 " 越 来 
吉 多 地 处 理 人 关 的 交往 信息 ， 所 以 高 级 编程 语言 也 越 来 浊 多 地 处 理 宁 
符 串 了 。 


想 想 字 符 串 的 定义 ， 再 看 看 这 样 一 个 字符 串 "python”， 还 记得 前 面 对 
字符 串 的 定义 吗 ? 它 吏 是 几 个 字符 (p、y、t、h、o、n) 排列 起 来 。 
这 种 排列 是 非常 严格 的 ， 不 仅仅 是 字 符 本 号， 而 且 还 有 有 顺序， 换 言 


之 ， 如 琳 某 个 字符 换 了 ， 束 变 成 一 个 新 字符 串 了 ; 如 采 这 些 字符 顺序 
发 生 了 变化 ， 则 也 将 成 为 一 个 新 字符 串 。 


在 Python 中 ， 把 像 字 符 串 这 样 的 对 象 类 型 (后 面 还 会 冒 出 来 类 似 的 其 
他 有 这 种 特点 的 对 象 类 型 ， 比 如 列表 ) 统称 为 序列 。 顾 名 思 义 ， 序 列 
忠 古 “有 序 排列 ”。 


水 泪 梁 山 的 108 个 好 汉 (里 面 分 明 也 有 女 的 ， 难 道 女 汉子 是 从 这 里 来 的 
吗 ? ) ， 就 是 一 个 “有 序 排列 * 的 序列 。 从 老大 宋江 一 直 排 到 第 108 位 金 
毛 犬 段 景 住 。 在 这 个 序列 中 ， 每 个 人 有 编写， 编号 和 每 个 人 一 一 对 
1 号 是 宋江 ，2 号 是 户 俊 义 。 有 反 过 来 ， 通 过 每 个 人 的 姓名 ， 也 能 找 
出 其 对 应 的 编号 : 武松 是 多 少 号 ? 14 号 。 李 和 违 呢 ? 22 号 。 


在 Python 中 ， 给 这 些 编号 取 了 一 个 文雅 的 名 字 ， 叫 作 索引 ( 别 的 编程 
语言 也 这 么 称呼 ， 不 是 Python 独 有 的 ) 。 


>>> lang = "study python" 


>>> lang[0] 


>>> lang[1] 
it 


变量 lang 是 贴 在 字符 串 “study python” 上 的 标签 ， 如 果 要 得 到 这 个 字符 
串 的 第 一 个 单词 98， 可 以 用 lang[0]。 


当然 ， 如 有 果 你 不 愿意 通过 赋值 语句 让 变量 lang 指 向 那个 字符 串 ， 也 可 
以 这 样 做 : 


>>> "study python'" [9] 


效果 是 一 样 的 ， 但 是 方便 程度 显而易见 。 


字符 串 这 个 序列 的 排序 方法 跟 梁 山 好 汉 有 点 不 同 : 第 一 个 不 是 用 数字 1 
表示 ， 而 是 用 数字 0 表示 ， 其 他 很 多 语言 也 都 是 从 0 开始 排序 的 。 为 什 
么 这 样 做 呢 ? 这 殉 是 规定 。 当 然 ， 这 个 规定 是 有 一 定 优势 的 ， 此 处 不 
展开 ， 有 兴趣 的 读音 可 以 去 网 上 搜索 一 仆 ， 有 专门 对 此 进行 解释 的 文 
于 可 


如 表 所 示 ， 将 这 个 字符 串 从 第 一 个 到 最 后 一 个 进行 了 排序 ， 特 别 注 
意 ， 两 个 单词 中 间 的 那个 空格 ， 也 占用 了 一 个 位 置 。 


通过 索引 能 够 找到 该 索引 所 对 应 的 字符 ， 那 么 反 过 来 ， 能 不 能 通过 子 
符 找 到 其 在 字符 串 中 的 索引 值 呢 ? 怎么 找 ? 


>>> lang.index("p") 


6 


这 样 是 不 是 已 经 能 够 和 深山 好 汉 的 例子 对 上 瑟 了 ? 只 不 过 区 别 在 于 程 
序 的 第 一 个 索引 值 是 0。 


如 条 某 一 天 ， 宋 江 大 哥 站 在 大 石头 上 ， 回 各 位 第 兄 大 喊 : “兄弟 们 ， 都 
排 好 队 。?” 等 兄弟 们 排 好 之 后 ， 宋 江 说 : “现在 给 各 位 没有 老婆 的 兄弟 
分 配 广 朋友， 我 这 里 已 经 有 了 名单 ， 我 念 到 的 兄弟 站 出 来 ， 不 过 我 是 
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在 前 面 的 例子 中 lang[1] 能 够 得 到 原来 子 符 串 的 第 二 个 字符 t， 束 相当 于 
从 原来 字符 串 中 把 这 个 “ 切 ” 出 来 了 。 不 过 ， 我 们 这 么 “ 切 ” 却 不 影响 原 
来 字符 串 的 完整 性 ， 当 然 也 可 以 理解 为 将 字符 t 复 制 一 份 拿 出 来 了 。 


0 
中。 


>>> lang 


"study python' # 在 前 面 “ 切 ”了 若干 的 字符 之 后 ， 再 看 一 下 该 字符 串 ， 还 是 完整 的 。 


>>> lang[2:9] 


"udy pyt' 


通过 lang[2:9] 要 得 到 多 个 (不 是 一 个 ) 字符 (来 源 于 原 字 符 串 ) ， 从 
返回 的 结果 中 可 以 看 出 ， 我 们 得 到 的 是 序号 分 别 对 应 着 2、3、4、5、 
6、7、8 ( 跟 上 面 的 表格 对 应 一 下 ) 的 字符 (包括 那个 空格 ) 。 


不 管 是 得 到 一 个 字符 还 是 多 个 字符 ， 通 过 索引 得 到 字符 的 过 程 都 称 之 
为 切片 。 


切片 是 一 个 很 有 意思 的 东西 ， 可 以 “ 切 ” 出 不 少 花 样 呢 。 


>>> lang 


'study python' 


>>> b = lang[1:] # 得 到 从 1 号 到 最 末尾 的 字符 ， 这 时 最 后 那个 不 用 写 
>3% 改 
"tudy python' 


> c = lang[:] # 得 到 所 有 字符 


"Study python' 


>>> d = lang[:10] # 得 到 从 第 一 个 到 19 号 之 前 的 字符 
>>> d 
"study pyth ' 


在 获取 切 厂 的 时 候 ， 如 有 果 冒 号 的 前 面 或 者 后 面 的 序号 不 写 ， 则 表示 两 
边 的 某 个 终点 位 置 ， 或 是 开头 ， 或 是 结尾 。 也 束 是 ，lang[:10] 的 效果 
和 1lang[0:10] 是 一 样 的 。 


>>> e = lang[0:10] 
>>> e 


"study pyth 


那么 ，lang[1:] 和 1lang[1:11] 效 果 一 样 吗 ? 请 思考 后 作答 。 


>>> lang[1:11] 
"tudy pytho' 
>>> lang[1:] 


在 “ 切 ” 字 符 的 时 候 ， 如 采 冒 号 后 面 有 数 子 ， 所 得 到 的 切 厂 不 包含 该 数 
字 所 对 应 的 字符 (前 包括 ， 后 不 包括 ) 。 那 么 ， 是 不 是 可 以 这 样 呢 ? 
lang[1:12] 不 包括 12 号 (事实 上 没有 12 号 ) ， 是 不 是 可 以 得 到 1 号 到 11 
号 对 应 的 字符 呢 ? 


>>> lang[1:12] 


"tudy python' 
>>> lang[1:13] 


"tudy python' 


果然 结果 和 猜测 的 一 样 ， 即 如 果 第 二 个 数字 大 于 字符 串 的 长 度 ， 得 到 
的 返回 结果 就 自动 到 最 大 长 度 位 置 终 止 。 但 是 请 注意 ， 这 种 获得 切片 


的 做 法 在 编程 实践 中 是 不 提倡 的 。 特 别 是 如 采 后 面 要 用 到 循环 的 时 
候 ， 这 样 做 很 可 能 会 遇 到 麻烦 。 


如 果 在 “切片 ”的 时 候 ， 冒 号 左右 都 不 写 数 子 ， 就 古 前 面 所 操作 的 
c=lang[:]， 其 结 采 是 变量 c 的 值 与 原 字 符 串 一 样 ， 即 “复制 *» 了 一 份 。 注 
意 ， 这 里 的 “复制 ”打上 了 引号， 意思 是 如 同 复制 ， 是 不 古 真 的 复制 
呢 ? 可 以 用 下 面 的 方式 检验 一 下 : 


3071934536L 


id0 的 作用 还 记得 吗 * 


从 上 面 可 以 看 出 ， 两 个 内 存 地 址 一 样 ， 说 明 c 和 lang 两 个 变量 指 同 的 是 
同一 个 对 象 。 用 c=lang[:] 的 方式 并 没有 生成 一 个 新 的 字符 串 ， 而 是 将 
变量 c 这 个 标签 也 贴 在 了 原来 那个 字符 串 上 了 。 


>>> lang = "study python" 
>> c = lang 


如 霖 这 样 操作 ， 变 量 c 和 lang 古 不 是 指 疝 同一 个 对 象 呢 ? 读者 可 以 目 行 


检验 。 


1.5.8 基本 操作 
所 有 序列 部 有 如 下 基本 操作 ， 字 符 串 是 序列 的 于 集 。 


len0: 返回 序列 长 度 。 

+: 连接 两 个 序列 。 

in: 判断 元 素 是 否 存 在 于 序列 中 。 

max(): 返回 最 大 值 。 

min0: 返回 最 小 值 。 

cmp (str1，str2) : 比较 两 个 序列 值 是 否 相同 。 


通过 下 面 的 例子 ， 将 这 几 个 基本 操作 在 字符 串 上 的 使 用 演示 一 下 。 


1)“+” 连 接 字 符 串 


"abcdabcde' 


>> stri + "-->" + Str2 


"abcd-->abcde' 


不 要 小 看 “+" 号 ， 到 此 只 是 学 了 字符 串 这 一 种 序列 ， 后 面 还 会 遇 到 列 
表 、 元 组 两 种 序列 ， 都 能 够 如 此 实现 拼接 。 


in 用 来 判断 某 个 字符 串 是 不 是 在 为 外 一 个 字符 串 内 ， 或 者 判断 某 个 字 
符 串 内 是 否 包含 某 个 字符 串 ， 如 果 包 含 ， 就 返回 True， 否 则 返回 
False ° 


3) 最 值 


>>> max (str1) 


>>> max(str2) 


>>> min(str1) 


在 一 个 字符 串 中 ， 每 个 字符 在 计算 机 内 都 是 有 编码 的 ， 也 就 是 对 应 着 
一 个 数字 ，min0 和 max0 就 是 根据 这 些 数字 获得 最 小 值 和 最 大 值 ， 然 
后 对 应 出 相应 的 字符 。 关 于 这 种 编号 是 多 少 ， 可 以 搜索 有 关 字 符 编 码 
或 者 ASCII 编 码 ， 很 容易 查 到 。 


4) 比较 


>>> cmp(str1, str2) 


-1 


将 两 个 字符 串 进 行 比较 ， 首 先 将 字符 囊 中 的 符号 转化 为 对 应 的 数字 
(怎么 对 应 数字 了 ? 请 参照 ASCII 理 解 ) ， 然 后 再 比较 。 如 果 返 回 的 


数值 小 于 零 ， 说 明 第 一 个 小 于 第 二 个 ; 等 于 0， 则 两 个 数值 相等 大 于 
人 “ 为 了 能 够 明日 其 所 以 然 ， 进 入 下 面 
» 分 O 


ord0 是 一 个 内 建 画 数 ， 能 够 返回 某 个 字符 (注意 ， 是 一 个 字符 ， 而 不 
是 多 个 字符 组 成 的 串 ) 所 对 应 的 ASCII 值 〈 是 十 进 制 的 ) ， 字 符 a 在 
ASCII 中 的 值 是 97， 空 格 在 ASCII 中 也 有 值 ， 是 32。 反 过 来 ,根据 整 数 
值得 到 相应 字符 ， 可 以 使 用 chr0): 


>>> Chr(97) 


>>> chr(98) 


‘pb! 


于 是 ， 得 到 如 下 比较 结果 : 


cmp("a", "b") #a- ->97，b-->98，97 小 于 98， 所 以 a 小 于 b。 


看 看 下 面 的 比较 是 怎么 进行 的 呢 ? 


>> cmp("ad", "c") 
"二 


在 字符 串 的 比较 中 ， 两 个 字符 串 的 第 一 个 字符 先 比较 ， 如 果 相 等 ， 就 
比较 下 一 个 ， 如 果 不 相 等 ， 就 返回 结果 。 如 果 直 到 最 后 还 相等 ， 就 返 
回 0。 位 数 不 够 时 ， 按 照 “ 没 有 ”处 理 (注意 , “没有 ”不 是 0，0 在 ASCII 
中 对 应 的 是 NUL) ， 位 数 多 的 那个 大 。ad 中 的 a 先 和 后 面 的 c 进 行 比 

较 ， 显 然 8 小 于 c， 于 是 返回 结果 -1。 但 进行 下 面 的 比较 ， 是 最 容易 让 
人 迷茫 的 。 读 者 能 不 能 根据 刚才 阐述 的 比较 原理 理解 得 到 的 结果 呢 ? 


2 Mp{' 123" 23 
a 
>>> cmp(123, 23) # 也 可 以 比较 整数 ， 这 时 候 就 是 整数 的 直接 比较 了 。 


1 
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字符 串 中 的 “乘法 ”含义 是 重复 那个 字符 串 ， 在 某 些 时 候 很 好 用 的 ， 比 
如 要 打印 一 个 华丽 的 分 割 线 : 


2 Stri * 8 
"abcdabcdabcd ' 
>>> print "-" * 20 # 不 用 输入 很 多 个 `、-、 


6) len0) 


要 知道 一 个 字符 串 有 多 少 个 字符 ， 一 种 方法 是 从 头 开 始 盯 着 屏幕 数 。 
哦 ， 这 不 是 计算 机 在 干 活 ， 征 “ 键 客 ”在 干 活 。 


0 


计算 机 这 样 来 数 子 符 串 长 度 : 


>>> a="hello" 


>>> len(a) 


5 


函数 lan0 返 回 该 字符 串 长 度 。 


>>> m = len(a) # 把 结果 返回 后 赋值 给 一 个 变量 
>>> mM 

5 

>>> type(m) # 这 个 返回 值 (变量 ) 是 一 个 整数 型 


<type 'int'> 


15.9 币 用 的 于 竺 吕方 读 


字符 串 的 方法 有 很 多 ， 可 以 通过 dir 来 查看 : 


>>> dir(str) 


| = bas ys "Ontoains. 0 Helattr or- do : S60 ', "= ormt *, + de". "gotattriby 
ti titeom  " gotnewargd. '; "getslice ", Tt Sy, hash init i ee len. At 
mul n 


mo y new_', '_reduce _', '_r _ ex. repr rmul_', '_se 
tattr ', '_ sizeof ', '_ str_', '_ subclasshook ', '_formatter_field name_split', '_formatter_parser', 'capitalize 


nd', "rindex'， 'rjust', "rpartition'， 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 't 
itle', 'translate', 'upper', 'zfill'] 


这 么 多 字符 串 方 法 当然 不 用 都 介绍 ， 因 为 有 一 种 方法 ， 读 者 可 以 随 用 
随 碍 阅 每 个 字符 串 方 法 是 如 何 使 用 的 。 


>>> help(str.isalpha) 
Help on method_descriptor: 
isalphal ce 
S.isalpha() -> bool 
Return True if all characters in S are alphabetic 


and there is at least one character in S, False otherwise. 


按照 这 里 的 说 明 ， 在 交互 模式 下 进行 实验 。 


>>> "python" .isalpha() # 字 符 串 全 是 字母 ， 应 该 返回 True 
True 

>>> "2python".isalpha() # 字 符 串 含 非 字母 ， 返 回 False 
False 


以 下 仅 列 举 几 个 常用 的 方法 。 
1) splitO 


其 作用 是 将 字符 串 根 据 某 个 分 割 符 进行 分 割 。 


>>> a = "I LOVE PYTHON" 


>>> a.split(" ") 


['I', 'LOVE', 'PYTHON'] 


这 里 用 空格 作为 分 割 ， 得 到 一 个 名 字 叫 作 列 表 (list) 的 返回 值 ， 关 于 
列表 的 内 容 ， 后 续 会 介绍 。 还 能 用 别 的 分 隅 吗 ? 


>>> b = "www.itdiffer.com" 


>>> b.split(".") 


['ww', 'itdiffer', 'com'] 


2) 去 掉 字 符 串 两 头 的 空格 


比如 让 用 户 输入 一 些 信息 ， 有 的 用 户 有 了 时候 会 在 信息 〈 比 如， 自己 的 
名 字 就 是 字符 种) 前 面 或 者 后 面 加 空格 。 这 些 空格 是 没 用 的 ， 在 使 用 
所 输入 的 信息 时 ， 必 须要 把 这 些 空格 去 掉 。 


Python 中 去 掉 空 格 的 方法 有 如 下 几 种 : 


S.strip(): 去 掉 字 符 串 的 左右 空格 
S.lstrip(): 去 掉 字 符 串 的 左边 空格 
S.rstrip(): 去 掉 字 符 串 的 右边 空格 


>>> b=" hello " # 两 边 有 空格 
>>> b.strip() 

'hello' 

>>> b 


» hello.” 


特别 注意 ， 原 来 的 值 没有 变化 ， 而 是 新 返回 了 一 个 结果 。 


>>> b.lstrip() # 去 掉 左边 的 空格 
'hello ， 
>>> b.rstrip() # 去 掉 右边 的 空格 
' hello' 


3) 字符 大 小 写 的 转换 


沁 文 有 时 候 要 用 到 大 小 写 转 换 。 最 有 名 的 是 史 峰 命名 ， 里 面 就 有 一 些 
大 写 和 小 写 。 如 采 有 兴趣 ， 可 以 来 这 里 学 习 目 动 将 字符 串 转 化 为 驼峰 
命名 形式 的 方法 (参见 : 
https://github.com/qiwsir/algorithm/blob/master/string_to hump.md) 。 相 
大力 信介 


。 S.upper() 
。 S.lower() 


。 S.capitalizel() 
S.isupper() 
S.islowerl() 

。 S.istitle() 


看 例子 : 


>>> a = "qiwsir,python" 


>>> a.upper() # 将 小 写字 母 完 全 变 成 大 写字 母 
'QIWSIR, PYTHON ' 


Sw # 原 数据 对 象 并 没有 改变 


'qiwsir,python' 
>>> b = a.upper() 
>>> b 


'QIWSIR, PYTHON' 


>>> c = b.lower() # 将 所 有 的 大 写字 母 变 成 小 写字 母 
bE 


'qiwsir,python' 


>>> a 


'qiwsir,python' 


>>> a.capitalize() # 把 字符 串 的 第 一 个 字母 变 成 大 写 
'Qiwsir,python' 

> # 原 数据 对 象 没有 改变 
'qiwsir,python' 

>>> b = a.capitalize() 

>>> b 


'Qiwsir,python' 


>>> a = "qiwsir,github" 


>>> a.istitle() 


False 

>>> a = "QIWSIR" # 当 全 是 大 写 的 时 候 ， 返 回 False 
>>> a.istitle() 

False 

>>> a = "qIWSIR" 

>>> a.istitle() 

False 

>>> a = "Qiwsir, github" # 如 果 这 样 ， 也 返回 False 


>>> a.istitle() 

False 

>>> a = "Qiwsir" # 这 样 是 True 
>>> a.istitle() 

True 

>>> a = 'Qiwsir,Github' # 这 样 也 是 True 
>>> a.istitle() 


True 


>>> a = "Qiwsir" 

>>> a.isupper() 

False 

>>> a.upper().isupper() 
True 

>>> a.islower() 

False 

>>> a.lower().islower() 
True 

>>> a = "This is a Book" 


>>> a.istitle() 


False 
>>> b = atitle() # 这 样 就 把 所 有 单词 的 第 一 个 字母 转化 为 大 写 
>>> b 


"This Is A Book ' 


>>> b.istitle() # 判 断 每 个 单词 的 第 一 个 字母 是 否 为 大 写 
4) join 连接 字符 串 

用 “+” 能 够 连接 字符 串 ， 但 不 是 什么 情况 下 都 能 够 如 愿 。 比 如 ， 将 列表 
(列表 是 另外 一 种 类 型 ) 中 的 每 个 字符 〈 串 ) 元 素 拼接 成 一 个 字符 


囊 ， 并 且 用 茶 个 符号 连接 ， 但 如 琳 用 “+” 会 比较 廊 烦 。 用 字符 串 的 join 
方法 吏 比 较 容 易 实现 。 


1.5.10 字符 串 格 式 化 输出 
什么 是 格式 化 ? 在 维基 百科 中 有 专门 的 词 条 ， 是 这 么 说 的 : 


格式 化 是 指 对 磁 如 或 磁盘 中 的 分 区 (Partition) 进行 初始 化 的 一 种 操 
作 ， 这 种 操作 通常 会 叶 致 现 有 的 位 副 或 分 区 中 所 有 的 文件 被 清除 。 


不 知道 你 是 否 知 道 这 种 “格式 化 ”*。 显然， 此 格式 化 非 我 们 这 里 所 说 
的 ， 我 们 说 的 是 字符 串 的 格式 化 ， 或 者 说 是 “格式 化 字符 串 ”， 表 示 的 


= FH es 昌 
局 \ 思 束 是 : 


格式 化 字符 串 ， 是 C、C++ 等 程序 设计 语言 printf 类 函数 中 用 于 指定 输 
出 参数 的 格式 与 相对 位 置 的 字符 串 参 数 。 其 中 的 转换 说 明 (conversion 
specification) 用 于 把 随后 对 应 的 0 个 或 多 个 函数 参数 转换 为 相应 的 格 
式 输出 ; 格式 化 字符 串 中 转换 说 明 以 外 的 其 他 字符 原样 输出 。 


这 也 是 来 目 维基 百科 的 定义 。 在 这 个 定义 中 ,用 C 语 言 作 为 例 于 ， 并 
且 用 了 其 输出 函数 来 说 明 。 在 Python 中 ， 也 有 同样 的 操作 和 类 似 的 画 


数 print， 此 前 我 们 已 经 了 解 一 二 了 。 

将 那个 定义 说 得 通俗 一 些 ， 字 符 串 格式 化 束 是 要 先 制定 一 个 模板 ， 在 
这 个 模板 中 某 个 或 者 某 几 个 地 方 留 出 空位 来 ， 然 后 在 那些 空位 填 上 字 
符 串 。 那 么 ， 那 些 空 位 需要 用 一 个 符号 来 表示 ， 这 个 符号 通 利 被 叫 作 
占 位 符 (仅仅 是 占据 着 那个 位 置 ， 并 不 是 输出 的 内 容 ) 。 


we I like %s" 


'I like %s' 


在 这 个 字符 串 中 ， 有 一 个 符号 “9%s”， 这 是 一 个 占 位 符 ， 可 以 被 其 他 的 
字符 串 代 蔡 。 比 如 


> I like %s" % "Pascal" 


这 十 较 为 第 用 的 一 种 子 符 串 输出 方式 。 
不 同 的 占 位 符 ， 和 表示 那个 位 置 应 该 被 不 同类 型 的 对 象 填 充 ， 如 表 1-3 所 
示 。 和 用 的 只 有 9%s、9%d 和 9%f， 如 打 需 要 其 他 的 ， 到 这 里 来 查 即 可 。 


看 例子 : 


>>> a = "%d years" % 15 
>>> print a 


15 years 


表 1-3” 占 位 符 


字符 串 ( 采 用 str0 的 显示 ) 


字符 串 (采用 repr0 的 显示 ) 


单个 字符 
- 进 制 整数 
上 进 制 整数 
指数 《底数 为 e) 
浮 点 数 
当然 ， 还 可 以 在 一 个 字符 串 中 设置 多 个 占 位 符 ， 就 像 下 面 一 样 : 


>>> print "Suzhou is more than %d years. %s lives in here." % (2500, "qiwsir") 


Suzhou is more than 2500 years. qiwsir lives in here. 


对 于 浮 点 数字 的 打印 输出 ， 还 可 以 限定 输出 的 小 数位 数 和 其 他 样式 : 
> print "Today's temperature is %.2f" % 12.235 
Today's temperature is 12.23 
> print "Today's temperature is %+.2f" % 12.235 
Today's temperature is +12.23 


注意 : 在 上 面 的 例子 中 ， 没 有 实现 四 舍 五 入 的 操作 ， 只 是 截取 ， 但 古 
上 面 的 例子 也 的 确 太 特殊 了 。 如 果 读 者 有 兴趣 ， 可 以 换 一 个 数 ， 自 己 
试 试 ， 在 一 般 情 况 下 古 能 够 实现 四 省 五 入 的 。 


关于 类 似 的 操作 还 有 很 多 变化 ， pe 如 果 
读者 在 编程 中 过 到 了 ， 可 以 到 网 上 查找 。 在 这 里 给 一 个 参考 图 示 ， 也 
征 从 网 上 下 载 的 ， 如 网 1-6 所 示 。 


数字 格式 团 描述 
3.1415926 {:.2f} 保留 小 数 点 后 两 位 
3.1415926 {:+.2 人 ; 带 符号 保留 小 数 点 后 两 位 
洒 {:+.2} 二 带 符 号 保留 小 数 点 后 两 位 
2.71828 {:.0f} 不 带 小 数 
{:0>2d} 数字 补 零 (填充 左边 , 宽度 为 2) 
{:x<4d} SXXX 数字 补 x (填充 右边 , 宽度 为 4) 


{:x<4d} 10xx 数字 补 x ( 盾 充 右边 , 宽度 为 4) 
1000000 ”人 1,000,000 以 逗号 分 隅 的 数字 格式 
0.25 {:.2%} 25.00% 百分比 格式 
1000000000{:.2e} 1.00e+09 指数 记 法 
13 {:10d)} 13 右 对 齐 (默认 , 宽度 为 10) 
13 {:<10d} 左 对 齐 (宽度 为 10) 
13 {:^10d} 中 间 对 齐 (宽度 为 10) 


图 1-6 字符 串 格式 


其 实 ， 上 面 这 种 格式 化 方法 ， 第 常 彼 认为 太 “ 十 老 ” 了 。 因 为 在 Python 
中 还 有 新 的 格式 化 方法 。 


>> S1 = "I like {}".format("python") 

>>> S1 

'I like python' 

>>> S2 = "Suzhou is more than {0} years. {1} lives in here.".format(2500, "qiwsir") 
>>> s2 


'Suzhou is more than 2500 years. qiwsir lives in here.' 


0 由 的 string.format() 的 格式 化 方法 ， 其 中 人 作为 占 
他 。 

这 种 方法 真得 非常 好 ， 而 且 非 常 简 单 ， 只 需要 将 对 应 的 东西 按照 顺序 
在 format 后 面 的 括号 中 排列 好 ， 分 别 对 应 占 位 符 { 即 可 。 


如 果 你 觉得 还 不 明确 ， 还 可 以 这 样 来 做 。 


>>> print "Suzhou is more than {year} years. {name} lives in here.".format(year=2500, name="qiwsir") 


Suzhou is more than 2500 years. qiwsir lives in here. 
真 的 很 简洁 、 优 雅 
AN O 
真 的 很 简洁 、 优 


还 有 一 种 格式 化 的 方法 是 "字典 格式 化 >， 这 里 仅仅 举 一 个 例子 ， 如 果 
读者 要 了 解 “字典 ”的 舍 义 ， 本 教程 后 续 会 有 的 。 


>>> print "I love %(program)s" % {"program":lang} 


I love python 


这 里 列举 了 三 种 基本 格式 化 的 方法 ， 你 喜欢 那 种 ? 我 推荐 : 


string.format() ° 


1.6 ”字符 编码 


在 Python 2.x 中 ， 字 符 编码 是 一 个 让 人 困惑 的 问题 ， 这 个 问题 在 Python 
3.x 中 目 然 解决 了 。 由 此 可 以 说 ， 未 来 是 Python 3 的 。 但 是 ， 由 于 前 面 
已 经 分 析 过 的 原因 ， 在 一 段 时 间 内 Python 2.x 还 不 能 完全 丢弃 ， 甚 至 不 
少 工程 项 目 还 是 以 它 为 主 。 所 以 ， 还 要 将 字符 编码 问题 单独 斤 述 。 


如 果 一 个 字符 串 都 是 英文 ， 就 没有 所 请 编码 问题 。 但 在 我 们 的 环境 
中 ， 中 文 是 我 们 不 得 不 用 的 。 


ame = ' 老 齐 ' 


你 在 交互 模式 中 遇 到 过 上 面 的 情形 吗 ? 这 就 是 显示 汉字 的 问题 ， 莫 文 
就 不 这 样 了 。 

难道 这 是 中 文 的 错 吗 ? 看 来 投胎 真 的 古 一 个 技术 活 。 是 的 ， 投 胎 是 技 
术 活 ， 但 上 面 的 问题 不 是 中 文 的 错 。 

1.6.1 编码 


什么 是 编码 ? 这 是 一 个 比较 系 手 的 问题 ， 也 不 好 下 一 个 普通 定义 。 我 
看 到 有 的 教材 中 有 定义 ， 且 不 敢 说 其 定义 不 对 ， 但 至 少 是 不 容易 理 


解 
“古代 打仗 ， 击 豆 进 攻 、 鸣 金 收 兵 ” 这 就 是 编码 。 把 要 传达 给 士兵 的 命 


令 对 应 为 一 定 的 其 他 形式 ， 比 如 命令 “进攻 "， 经 过 信息 传递 ， 如 图 1-7 
所 示 。 


进攻 


误 读 


1) 长 官 下 达 进 攻 命令 ， 传 令 员 将 这 个 命令 编码 为 鼓 声 。 


x 
2) 鼓 声 在 空气 中 传播 ， 比 传令 员 的 嗓子 吃 出 来 的 声音 传播 得 更 远 ， 十 
es 会 有 此 义 ， 这 吏 是 “进攻 "命令 被 编码 成 玖 声 之 后 的 优势 


3) 士兵 听 到 鼓 声 ， 就 是 接收 到 信息 ， 如 果 接 受过 训练 或 者 有 人 告诉 过 
他 们 ， 他 们 头 知道 这 是 命令 进攻 ， 这 个 过 程 束 是 解码 。 所 以 ， 编 码 方 
案 要 有 两 到 ， 一 套 在 信息 发 出 者 那里 ， 另 外 一 套 在 信息 接受 者 这 里 。 

经 过 解码 之 后 ， 士 兵 明 日 了 才 行 动 。 


以 上 过 程 比 较 简单 ， 但 真实 的 编码 和 解码 过 程 比 这 个 复杂 。 不 过 ， 
理 都 差不多 。 


河 


举 一 个 似乎 遥远 ， 其 实 不 久 前 人 们 都 在 使 用 的 东西 做 例子 : 电报 (以 
下 引用 的 内 容 来 自 《 维 基 百 科 》) 。 


电报 息 通 信 业 务 的 一 种 ， 在 19 世 纪 初 发 明 ， 是 最 早 使 用 电 进 行 通信 的 
方法 。 电 报 大 为 加 快 了 消息 的 流通 ， 是 工业 社会 的 一 项 重要 发 明 。 早 
期 的 电报 只 能 在 陆地 上 通信 ， 后 来 使 用 了 海 搬 电缆， 开展 了 越 详 服 

务 。 到 了 20 世 纪 初 ， 开 始 使 用 无 线 电 波 发 电报 ， 电 报 业 务 基 本 上 已 能 
抵达 地 球 上 大 部 分 地 区 。 电 报 主 要 用 作 传 递 文字 讯 电 ， 使 用 电报 技术 
用 作 传送 图 片 称 为 传真 。 


中 国 出 现 首 条 电报 线路 是 1871 年 ， 由 英国 、 俄 国 及 丹麦 敷设 ， 从 中 国 
香港 经 上 海 至 日 本 长 崎 ， 且 是 海底 电缆 。 由 于 清 政 府 的 反对 ， 电 缆 被 
禁止 在 上 海 登录 。 后 来 丹麦 公司 不 理 清 政府 的 禁令 ， 将 线路 引 至 上 海 
公共 租界 ， 并 在 1871 年 6 月 3 日 起 开始 收发 电报 。 至 于 中 国 首 条 目 主 数 
设 的 线路 ， 是 由 福建 巡抚 丁 日 昌 在 中 国 台湾 所 建 ，1877 年 10 月 完工 ， 

连接 台南 及 高 雄 。1879 年 ， 北 洋 大 臣 李 鸿 章 在 天 津 、 大 沽 及 北 塘 之 间 
架设 电报 线路 ， 用 作 军 事 通信 。1880 年 ， 李 鸿 章 奏 准 开办 电报 总 局 ， 

由 盛 宣 怀 任 总 办 。 并 在 1881 年 12 月 开通 天 津 至 上 海 的 电报 服务 。 李 鸿 
章 说 : “五 年 来 ， 我 国 创 设 沿江 沿海 各 省 电线 ， 总 计 一 万 多 里 ， 国 家 所 
费 无 多 ， 巨 款 来 自 民 间 。 当 时 正 值 法 人 挑 余 ， 将 帅 报 告 军情 ， 朝 廷 传 
达 指 示 ， 均 相机 而 动 ， 无 丝毫 阻碍 。 中 国 目 古 用 兵 ， 从 未 如 此 神速 。 

出 使 大 臣 往 来 问答 ， 朝 发 夕 至 ， 相 隅 万 里 好 似 同 居 庭 院 。 举 设 电 报 一 
举 三 得 ， 既 防止 外 敌 侵 略 ， 又 加 强国 防 ， 亦 有 利于 商务 。” 天 津 官 电 局 
于 庚 子 遭 乱 全 毁 。1887 年 ， 台 湾 巡 抚 刘 铭 传 敷设 了 福州 至 台湾 的 海 确 
电缆 ， 是 中 国 首 条 海底 电缆 。1884 年 ， 北 京 电 报 开 始 建 设 ， 采 用 "“ 安 设 
双 线 ， 由 通州 展 至 京城 ， 以 一 端 引 入 署 中 ， 专 递 官 信 ， 以 一 端 择 地 安 
置 用 便 商 民 ”，8 月 5 日 ， 电 报 线路 开始 建设 ， 所 有 电线 杆 一 律 潜 成 红 

色 。8 月 22 日 ， 位 于 北京 尝 文 门 外 大 街 西 的 喜鹊 衣 同 的 外 城 商 用 电报 局 

目 La 


为 了 传达 汉字 ， 电 报 部 门 准 备 由 4 位 数字 或 3 位 罗马 字 构 成 的 代码 ， 即 
中 文 电 码 ， 采 用 发 送 前 将 汉字 改写 成 电码 发 出 ， 收 电报 后 再 将 电码 改 
写成 汉字 的 方法 。 


注意 : 这 里 出 现 了 电报 中 用 的 “中 文 电码 *， 这 就 是 一 种 编码 ， 将 汉字 
对 应 成 阿拉 伯 数 字 ， 从 而 能 够 用 电报 发 送 汉字 。 


1873 年 ， 法 国 狂 华人 员 威 基 杰 参照 《 康 申 字典 》 的 部 站 排列 方法 ， 挑 
选 了 常用 汉子 6800 多 个 ， 编 成 了 第 一 部 汉字 电码 本 《电报 新 书 》。 


电报 中 的 编码 被 称 为 摩尔 斯 电码 ， 英 文 是 Morse Code 。 


摩尔 斯 电码 (英语 :Morse Code) 是 一 种 时 通 时 断 的 信号 代码 ， 通 过 
不 同 的 排列 顺序 来 表达 不 同 的 英文 字母 、 数 字 和 标点 符号 。 是 由 美国 
人 萨 比 尔 :摩尔 斯 在 1836 年 发 明 。 


摩尔 斯 电码 是 一 种 早期 的 数字 化 通信 形式 ， 但 是 它 不 同 于 现代 只 使 用 0 
和 1 两 种 状态 的 二 进 制 代码 ， 它 的 代码 包括 五 种 : 点 (.) 、 划 (-) 、 
每 个 字符 间 短 的 停顿 〈 在 点 和 划 之 间 的 停顿 ) 、 每 个 词 之 间 中 等 的 停 
顿 以 及 句子 之 间 长 的 停顿 。 


看 来 电报 员 是 一 个 技术 活 ， 不 同 长 短 的 停顿 都 代表 了 不 同意 思 。 哦 ， 
对 了 ， 有 一 个 老 片 子 叫 《 永 不 消逝 的 电波 》， 保 证 你 看 完 之 后 才 知 
道 ， 里 面 根本 殉 没 有 讲 电报 是 怎么 编码 的 。 


摩尔 斯 电码 在 海事 通信 中 被 作为 国际 标准 一 直 使 用 到 1999 年 。1997 
年 ， 当 法 国 海军 停止 使 用 摩尔 斯 电码 时 ， 发 送 的 最 后 一 条 消息 是 : “所 
有 人 注意 ， 这 有 是 我 们 在 永远 沉 条 之 前 最 后 的 一 声呐 喊 ! ” 


我 输 痢 眼看 了 老 长 时 间 ， 这 两 行 不 是 一 样 的 吗 ? 

不 管 这 个 了 ， 总 之 ， 这 就 是 编码 。 

1.6.2 ”计算 机 中 的 字符 编码 

抄 一 段 维基 百科 对 字符 编码 的 解释 : 

字符 编码 (英语 : Character Encoding) ， 也 称 为 字 集 码 ， 是 把 字符 集 


中 的 字符 编码 为 指定 集合 中 某 一 对 象 〈 例 如: 比特 模式 、 目 然 数 串 
行 、8 位 组 或 者 电 脉冲 ) ， 以 便 文本 在 计算 机 中 存储 和 通过 通信 网 络 的 


传递 。 毅 见 的 例子 包括 将 拉丁 字母 表 编 码 成 摩 斯 电码 和 ASCII。 其 

中 ，ASCII 将 字母 、 数 字 和 其 他 符号 编号 ， 并 用 7 比特 的 二 进 制 来 表示 
。 通 常会 额外 使 用 一 个 扩充 的 比特 ， 以 便于 以 1 个 字 节 的 方式 
他 去 o 


在 计算 机 技术 发 展 的 早期 ， 如 ASCII (1963 年 ) 和 EBCDIC (1964 年 ) 
这 样 的 字符 集 逐 渐 成 为 标准 。 但 这 些 字 符 集 的 局 限 很 快 就 变 得 明显 ， 
于 是 人 们 开发 了 许多 方法 来 扩展 它们 。 对 于 支持 包括 东亚 CJK 字 符 家 
族 在 内 的 写作 系统 的 要 求 能 支持 更 大 量 的 字符 ， 并 且 需 要 一 种 系统 而 
不 是 临时 的 方法 实现 这 些 字符 的 编码 。 


在 这 个 世界 上 ， 有 好 多 不 同 的 字符 编码 。 但 是 ， 它 们 不 是 目 己 随便 捅 
搞 的 ， 而 是 要 有 一 定 的 基础 ， 往 往 是 以 名 叫 ASCII 的 编码 为 基础 。 


ASCII (American Standard Code for Information Interchange， 美 国信 息 
交换 标准 代码 ) 是 基于 拉丁 字母 的 一 套 电 脑 编码 系统 。 它 主要 用 于 显 
示 现 代 英 语 ， 而 其 扩展 版 本 EASCII 则 可 以 部 分 支持 其 他 西欧 语言 ， 并 
等 同 于 国际 标准 ISO/IEC 646。 由 于 万 维 网 使 得 ASCII 广 为 通用 ， 直 到 
2007 年 12 月 ， 逐 渐 被 Unicode 取 代 。 


上 面 的 引文 中 已 经 说 了 ， 现 在 我 们 用 的 编码 标准 已 经 变 成 Unicode 了 
(Python3.x 束 是 用 了 Unicode) ， 那 么 什么 是 Unicode 呢 ? 还 是 抄 一 段 
来 自 维基 百科 的 说 明 : 


Unicode (中 文 : 万 国 码 、 国 际 码 、 统 一 码 、 单 一 码 ) 是 计算 机 科学 领 
域 里 的 一 项 业界 标准 。 它 对 世界 上 大 部 分 的 文字 系统 进行 了 整理 、 编 
码 ， 使 得 电脑 可 以 用 更 为 简单 的 方式 来 呈现 和 处 理 文字 。 


Unicode 伴 随 着 通用 字符 集 的 标准 而 发 展 ， 同 时 也 以 书本 的 形式 对 外 发 
表 。Unicode 至 今 仍 在 不 断 增 修 ， 每 个 新 版 本 都 加 入 更 多 新 的 字符 。 目 
前 最 新 的 版 本 为 7.0.0， 已 收入 超过 十 万 个 字符 (第 十 万 个 字符 在 2005 
年 获 采 纳 ) 。Unicode 酒 盖 的 数据 除了 视觉 上 的 字形 、 编 码 方法 、 标 准 
的 字符 编码 外 ， 还 包含 了 字符 特性 ， 如 大 小 写 子 母 。 


听 这 和 名字 : 万 国 码 ， 那 就 一 定 包 含 了 中 文 。 但 是 ， 光 有 一 个 Unicode 还 
是 不 够 用 〈 可 以 访问 《维基 百科 》 网 站 查看 相关 说 明 ) ， 还 要 有 其 他 
的 一 些 编码 实现 方式 ，Unicode 的 实现 方式 称 为 Unicode 转 换 格 式 


(Unicode Transformation Format， 简 称 为 UTF) ， 于 是 平 有 了 一 个 我 
们 在 很 多 时 候 都 会 看 到 的 utf-8。 


什么 是 utf-8? 还 是 看 维基 百科 上 怎么 说 的 吧 : 


UTF-8 (8-bit Unicode Transformation Format) 是 一 种 针对 Unicode 的 可 
变 长 度 字 符 编 码 ， 也 是 一 种 前 绥 码 。 它 可 以 用 来 表示 Unicode 标 准 中 的 
任何 字符 ， 且 其 编码 中 的 第 一 个 字 节 仍 与 ASCII 兼 容 ， 这 使 得 原来 处 
理 ASCII 字 符 的 软件 不 需要 或 只 做 少 部 份 修 改 ， 即 可 继续 使 用 。 
,0 电子 邮件 、 网 页 及 其 他 存储 或 发送 文字 的 应 用 中 优先 
采用 的 编码 。 


是 不 是 理解 了 呢 ? 前 面 写 程 序 的 时 候 ， 曾 经 出 现 过 coding:utf-8 的 字 
样 ， 束 是 在 告诉 Python 我 们 要 用 什么 字符 编码 。 


1.6.3 encode 和 decode 
encode() 和 decode() 古 两 个 内 置 久 数 。 


codecs.encode (obj[, encoding[, errors]]) :Encodes obj using the codec 
registered for encoding. 


codecs.decode (obj[, encoding[, errors]]) :Decodes obj using the codec 
registered for encoding. 


Python2 默 认 的 编码 是 ASCII， 通 过 encode() 可 以 将 对 象 的 编码 转换 为 指 
So ( 称 作 “编码 ”) ， 而 decode 是 这 个 过 程 的 逆 过 程 ( 称 作 “ 解 


做 一 个 实验 ， 才 能 理解 : 


'\xe4\xb8\xad' 


>>> len(a) 


>>> b = a.decode() 


Uu'\u4e2d' 

>>> type(b) 
<type 'unicode'> 
>>> len(b) 


1 


在 做 这 个 实验 之 前 ， 或 许 还 不 是 很 迷茫 《知道 得 越 多 越 迷茫) ， 实 验 
做 完了 ， 目 己 也 迷茫 了 。 别 急躁 ， 对 编码 问题 的 理解 要 慢 慢 来 ， 如 果 


一 时 理解 不 了 ， 就 先 按照 要 求 做 ， 做 着 做 着 残 锥 然 开 衣 了 。 


变量 a 引用 了 一 个 字符 串 类 型 对 象 ， 但 关 格 地 讲 是 子 市 串 ， 因 为 它 是 经 
过 编码 后 的 子 市 组 成 的 序列 。 也 就 是 你 在 上 面 的 实验 中 看 到 的 “中 ”这 
个 字 在 计算 机 中 编码 之 后 的 字 节 表示 。 (关于 字 节 可 以 搜索 一 下 ) 

用 len (a) 来 度量 它 的 长 度 ， 它 是 由 三 个 字 节 组 成 的 。 

然后 通过 decode 函 数 将 字 世 串 转 变 为 字符 串 ， 并 且 这 个 字符 串 是 按照 
Unicode 编 码 的 。 在 Unicode 编 码 中 ， 一 个 汉字 对 应 一 个 字符 ， 这 时 候 
度量 它 的 长 度 就 是 1 。 


肥 过 来 ， 一 个 Unicode 编 码 的 字符 串 也 可 以 转换 为 字 市 串 。 


>>> c = b.encode('utf-8') 


'\xe4\xb8\xad' 
>>> type(c) 


天 于 编码 问题 完 到 这 里 点 到 为 止 吧 。 因 为 再 扯 ， 还 会 扯 出 问题 来 ， 读 
者 肯定 感到 不 满意 ， 因 为 还 没有 知 其 所 以 然 。 

1.6.4 ”避免 中 文 是 乱码 

“避免 中 文 是 乱码 ” 是 一 个 具有 很 强 操作 性 的 问题 。 

目 完 ， 提 倡 使 用 utf-8 编 码 方 案 ， 因 为 它 跨 平台 不 错 。 

经 验 一 ， 在 开头 声明 : 


# -*- coding: utf-8 -*- 


有 朋友 问 我 <-*-” 有 什么 作用 ， 那 个 束 是 为 了 好 看 ， 爱 美 之 心 人 缘 有 ， 
更 何况 程序 员 ? 当然 ， 也 可 以 写成 : 


# coding:utf-8 


经 验 二 ， 遇 到 字符 〈 节 ) 串 ， 立 刻 转化 为 unicode， 不 要 用 str0， 直 接 
使 用 unicode(): 


unicode_str = unicode(' 中 文 '，encoding='utf-8') 


print unicode_str.encode('utf-8') 


经 验 三 ， 如 果 对 文件 操作 ， 打 开 文 件 的 时 候 ， 最 好 用 codecs.open 蔡 代 
open (关于 文件 的 操作 ， 请 参阅 后 续 内 容 。) 


import codecs 


codecs.open('filename', encoding='utf8') 
最 后 ， 如 采用 Python3， 这 种 编码 的 烦恼 会 少 一 点 。 


1.7 列表 
此 前 ， 已 经 知道 了 三 种 Python 的 对 象 类 型 : int、float 和 str。 


这 一 节 中 的 list 类 型 ， 也 十 Python 的 一 种 对 象 类 型 ， 翻 译 为 : 列表 。 下 
面 的 加 粗 字 ， 请 读者 注意 : 


list 在 Python 中 具有 非常 强大 的 功能 。 
1.71 定义 
在 Python 中 ， 用 方 括 号 表示 一 个 list: 0] 


方 括号 里 面 的 元 素 类 型 ， 可 以 是 int， 也 可 以 是 str 类 型 的 数据 ， 甚 至 也 
能 够 是 True/False 这 种 布尔 值 。 看 下 面 的 例子 ， 要 特别 注意 阅读 注释 。 


>>> a=[] # 定 义 了 一 个 空 的 列表 ， 变 量 a 相 当 于 一 个 贴 在 其 上 的 标签 


>>> type(a) 


<type 'list'> # 用 内 置 画 数 type( ) 查 看 变量 a 引用 对 象 的 类 型 ， 为 ]ist 
>>> bool(a) # 用 内 置 画 数 bool( ) 看 看 a 的 布尔 值 ， 因 为 是 空 的 ， 所 以 为 False 
False 


>>> print a # 打 印 


[] 


bool0 征 一 个 布尔 函数 ， 在 后 续 章 万 会 详 述 。 它 的 作用 吏 是 来 判断 一 个 
对 象 是 “ 真 ”* 还 是 “ 假 ”( 空 ) 。 如 果 像 上 面 的 例子 那样 ， 列 表 中 什么 也 
没有 吏 是 空 的 ， 用 bool0) 范 数 来 判断 ， 得 到 False， 从 而 显示 它 是 空 


一 个 列表 中 能 够 容纳 多 少 东 西 ?“ 有 容 乃 大 ”是 对 列表 最 好 的 形容 了 ， 
它 的 大 小 仅 受 制 于 硬件 设备 和 你 的 意愿 。 


如 果 你 已 经 了 解 了 别 的 语言 ， 比 如 比较 常见 的 Java， 里 面 有 一 个 跟 list 
相似 的 数据 类 型 数组 一 一 但 是 两 者 还 是 有 区 别 的 。 在 Java 中 ， 数 
组 中 的 元 素 必 须 是 基本 数据 类 型 中 的 某 一 个 ， 也 就 是 要 么 都 是 int 类 
型 ， 要 么 都 是 char 类 型 等 ， 不 能 一 个 数组 中 既 有 int 类 型 又 有 char 类 型 。 
这 是 因为 Java 中 的 数组 需要 提前 声明 ， 声 明 的 时 候 就 确定 了 里 面 元 素 
的 类 型 。 但 是 尽管 Python 中 的 list 与 Java 中 的 数组 有 类 似 的 地 方 都 
是 [上] 包 焉 的 list 中 的 元 素 是 任意 类 型 的 ， 可 以 是 int、str， 还 可 以 是 
list， 甚 至 是 dict 等 。 所 以 ， 有 一 句 话 说: 列表 是 Python 中 的 苦力 ， 什 
么 都 可 以 干 。 


1.7.2 ”索引 和 切记 


天 于 索引 和 切片 的 舍 义 在 字符 串 划 市 已 经 熟知 了 。 所 以 ， 这 里 可 以 很 
快 用 起 来 。 


>>> url = "qiwsir.github.io" 


>>> url[2] 


>>> url[:4] 


"qiws' 


> Uri[3:9] 


由 


在 列表 中 也 有 类 似 的 操作 。 只 不 过 是 以 元 素 为 单位 ， 而 不 是 以 字符 为 
单位 进行 索引 。 


E23 Himsir githubsio”] 
>> a[9] # 索 引 序号 也 是 从 0 开始 
121 


3 
['2', 3] 


[3, 'gqiwsir.github.io'] 


列表 和 字符 串 两 种 类 型 都 属于 序列 (都 是 一 些 对 象 按照 某 个 次 序 排列 
起 来 ， 这 是 序列 的 最 大 特征 ) ， 因 此 ， 他 们 有 很 多 类 似 的 地 方 。 如 刚 
才 演 示 的 索引 和 切 族 是 非常 一 致 的 。 


>>> lang = "python" 

>>> lang.index("y") 

1 

>>> lst = ['python','java','c++'] 
>>> lst.index('java') 


1 


索引 数字 从 左边 开始 编号 ， 第 一 个 是 0， 然 后 依次 增加 1 。 


此 外 ， 还 有 一 种 编号 方式 是 从 右边 开始 ， 右 边 第 一 个 可 以 编号 为 -1， 
然后 同 左 依次 是 ，-2，-3，...， 依 次 类 推 下 来 。 这 对 字符 串 、 列 表 等 各 
种 序列 类 型 都 适用 。 


从 右边 开始 编号 ， 第 -1 号 是 右边 第 一 个 。 但 是 ， 如 宁 要 切片 的 话 ， 应 
该 注意 : 

>>> lang[-1:-3] 

>>> lang[-3:-1] 


>>> lst[-3:-1] 


['python', 'java'] 


序列 的 切片 ， 一 定 要 左边 的 数字 小 于 右边 的 数字 ，lang[-1:-3] 就 没有 遵 
守 这 个 规则 ， 返 回 的 是 一 个 空 。 


1.7.3 反 转 
肥 转 在 编程 中 常常 会 用 到 。 通 过 举例 来 说 明 反 转 的 方法 : 


zx alst = [1,2,3;4,5;8] 


>>> alst[::-1] 
[6, 5, 4, 3, 2, 1] 
>>> alst 


[1, 2, 3, 4, 5, 6] 


当然 ， 对 于 子 符 串 也 可 以 : 


征 否 注意 到 ， 不 管 是 str 还 是 lst， 反 转 之 后 原来 的 值 没有 改变 。 这 束 说 
明 ， 这 里 的 反 转 ， 不 是 在 “ 原 地 ”把 原来 的 值 倒 过 来 ， 而 是 新生 成 了 一 
个 值 ， 生 成 的 值 跟 原 来 的 值 相 比 ， 有 是 倒 过 来 了 。 


这 征 一 种 非常 简 单 的 方法 ， 虽 然 我 在 写 程 序 的 时 候 间 着 使 用 ， 但 并 不 
古 十 分 推荐 ， 因 为 它 有 时 候 让 人 感觉 迷 荡 。Python 还 有 为 外 一 种 方法 
计 tlist 反 转 ， 且 比较 容易 理解 和 阅读 ， 特 别 推荐 之 : 


>>> list(reversed(alst)) 


[6, 5, 4, 3, 2, 1] 


这 个 比较 简单 ， 而 且 很 容易 看 懂 ， 不 是 吗 ? 
顺便 给 出 reversed 函 数 的 详细 说 明 : 


>>> help(reversed) 


Help on class reversed in module _ builtin : 


class reversed(object) 
| reversed(sequence) -> reverse iterator over values of the sequence 
| 


| Return a reverse iterator 


它 返 回 一 个 可 以 妈 代 的 对 象 《关于 迭代 的 问题 ， 请 参阅 后 续 内 容 ) ， 
不 过 已 经 将 原来 的 序列 对 象 反 转 了 “。 比 如 : 


>>> list(reversed("abcd")) 


很 好 、 很 强大 ， 特 别 推荐 使 用 。 
1.7.4 对 list 的 操作 


在 字符 串 那 部 分 已 经 提 到 过 ， 所 有 的 序列 都 有 几 种 基本 操作 。 列 表 是 
一 种 序列 ， 当 然 如 此 。 


1.len() 


wi Lat 
['python', 'java', 'c++'] 
>>> len(lst) 


3 


连接 两 个 序列 


>>> lst 

['python', 'java', 'c++'] 
>>> alst 

Ls 2 3 Mi Sy 6] 

>>> lst + alst 


['python', 'java', 'c+t+', 1, 2, 3, 4, 5, 6] 


3.*， 重 复元 素 


>>> lst 
['python', 'java', 'c++'] 
wi Lat * 3 


["'python', java', c++"', “python' 'java'; “c++ "python', 'java', "c++ '] 
4.in 


列表 ]st 还 是 前 面 的 值 : 


>>> "python" in lst 
True 
>>> "c#" in lst 


False 


5.max(0 和 min(0) 
以 int 类 型 元 系 为 例 : 


>>> alst 

[1, 2, 3, 4, 5, 6] 
>>> max(alst) 

6 

>>> min(alst) 

1 

>>> max(lst) 
'python' 

>>> min(lst) 


"C++' 


6.cmp() 
采用 上 面 的 方法 ， 进 行 比较 : 


>>> lsta = [2,3] 

>>> lstb = [2,4] 

>>> cmp(lsta,1stb) 
-1 

>>> lstc = [2] 

>>> cmp(lsta,1lstc) 
1 

>>> lstd = ['2','3'] 
>>> cmp(lsta, lstd) 


= 二 


7. 追 加 元 素 


>>> a = ["good", "python", "I"] 
= a 
['good', 'python', 'I'] 


>>> a.append("like") # 向 ]ist 中 添加 str 类 型 "like" 


>>> a 
['good', 'python', 'I', 'like'] 
>>> a.append(100) # 向 1ist 中 添加 int 类 型 100 


>>> a 


['good', 'python', 'I', 'like', 100 


官方 文档 这 样 描述 listappend0) 方 法 : 


list.append(x) 


Add an item to the end of the list; equivalent to a[len(a):] = [x]. 


是 否 已 经 理解 了 list.append (x) 的 含义 呢 ? 即将 新 的 元 素 x 追 加 到 list 
的 尾部 。 


如 果 注 意 看 上 面 官方 文档 中 的 那 句 话 ， 应 该 注意 到 后 面 半 人 句 : 

equivalent to a[len (a) :]=[x]， 意 思 是 说 list. nn (x) 等 效 于 allen 

1 EE 这 也 相当 于 告诉 我 们 另外 一 种 追 和 加 元 素 的 方法 ， 并 且 两 
法 等 光 


>>> a 


['good', 'python', 'I', 'like', 100] 


>>> a[len(a):]=[3] #1len(a), 即 得 到 1ist 的 长 度 ， 这 个 长 度 是 指 1ist 中 的 元 素 个 数 。 
a 

['good', 'python', 'I', 'like', 1090, 3] 

>>> len(a) 

6 

>>> a[6:]=['xxoo'] 

>>> a 


['good', 'python', 'I', 'like', 100, 3, 'xxo0'] 


1.7.5 列表 的 函数 


什么 是 方法 ? 方法 和 画 数 有 什么 区 别 ? 这 里 暂 不 区 分 和 解释 。 请 把 这 
个 名 词 “方法 ”抽象 出 来 ， 到 后 而 自然 明了 (下 面 的 内 容 中 ， 没 有 区 
分 "函数 "和 "方法 ”， 读 者 不 要 介意 这 个 名 词 ) 。 


列表 是 Python 中 的 苦力 ， 那 么 它 都 有 哪些 男 数 呢 ? 或 者 对 它 能 做 什么 


呢 ? 


> dir(list) 
ay add '_clas ontains__', '_ delattr ', '_ delitem ', '_delslice ', '_doc ', '_ eq _', '_for 
mat__', '_ ge getattri ibu te ', '_ getitem ', '_ getslice ', '_ gt _', '_hash_', '_iadd '，' imul __', 
a a te er le Jen_', "lt ' '_mul ', '_ne _', '_new ', '_reduce ', '_reduce ex _', 
epr__', ed Po rmul Se tatt setite etslic DEL 
sho es Bppen nao 有 "extend'， 'index', 'insert', 'pop', 'remove', 'reverse', 'sort'] 


上 面 的 结果 中 ， 以 双 下 画 线 开始 和 结尾 的 暂时 不 管 ， 如 _add (以 后 
会 管 的 | 。 就 剩 下 以 下 几 个 了 : 


"append'， 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort' 


pe 这 些 函 数 进行 说 明和 演示 ， 这 都 是 在 编程 实践 中 闻 第 要 用 到 


1.append 和 extend 


前 面 提 到 的 列表 基本 操作 中 有 list.append (x) ， 也 就 是 将 某 个 元 素 x 追 
加 到 已 知 的 一 个 列表 的 尾部 。 


除了 将 元 素 退 加 到 列表 中 ， 还 能 够 将 两 个 列表 合并 ， 或 者 说 将 一 个 列 
表 退 加 到 男 外 一 个 列表 中 。 按 照 惯 例 ， 首 先 还 是 看 官方 文档 中 的 摘 


壕 : 


list.extend(L) 


Extend the list by appending all the items in the given list; equivalent to a[len(a):] = L. 


RR 


将 官方 文档 的 这 句 话 翻译 过 来 : 
通过 将 所 有 元 素 追 加 到 已 知 list 来 扩充 它 ， 相 当 于 aflen (a) :]=L 
英语 大 烂 ， 翻 译 太 差 。 直 接 看 例子 ， 更 明日 : 


Se Ta 


[1，2，3] 
> 1b 
['qiwsir', "python '] 


>>> la.extend(1b) 


>>> la 
[1, 2, 3, 'qiwsir'， "python '] 
SH 


['qiwsir', 'python'] 


上 面 的 例子 显示 : 有 两 个 list， 一 个 是 la， 男 外 一 个 是 lb， 将 lb 这 个 列表 
extend 到 la 的 后 面 ， 也 就 是 把 lb 中 的 所 有 元 素 加 入 到 la 中 ， 即 让 la 扩 


学 程序 一 定 要 有 好 奇 心 ， 我 在 交互 环境 中 经 实验 目 己 的 想法 ， 有 时 
甚至 是 比较 是 春 的 想法 。 


a = [1,2,3] 
>b= "abc" 


1 
b 
>>> la.extend(b) 
由 
2 


>>> la.extend(c) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: 'int' object is not iterable 


从 上 面 的 实验 中 ， 你 能 够 有 什么 心得 ? 原来 ， 如 果 操 作 extend (str) 
的 时 候 ，str 被 以 字符 为 单位 拆 开 ， 然 后 追加 到 la 里 面 。 


如 条 extend 的 对 象 是 数值 型 ， 则 报错 。 


所 以 ，extend 的 对 象 是 一 个 list， 如 果 是 sr， 则 Python 会 先 把 它 按照 字 
符 为 单位 转化 为 list 再 追加 到 已 知 list 。 


别 未 记 了 前 面 官方 文档 的 后 半 句 话 ， 它 的 意思 和 是: 


>>> la 


下 
>>> 1b 

['qiwsir', 'python'] 

>>> la[len(1a):]=1b 

>>> la 


Li -2 Be iwi python’] 


list.extend (L) 等 效 于 list[len (list) :]=L, 工 是 待 并 入 的 list 。 


概括 起 来 ，extend 函 数 也 是 将 另外 的 元 素 增加 到 一 个 已 知 列表 中 ， 元 
素 必 须 是 iterable， 什 么 是 iterable? 


iterable， 中 文 含义 是 “可 送 代 的 。 在 Python 中 还 有 一 个 词 ， 束 是 
iterator， 这 个 叫 作 * 达 代 需 ”， 这 两 者 有 着 区 别 和 联系 。 


为 了 解释 iterable 〈 可 迭代 的 ) ， 又 引入 了 一 个 词 “* 友 代 ”， 什 么 是 欠 代 


呢 ? 


尽管 我 们 很 多 文档 是 用 英文 写 的， 但 是 ， 如 有 果 你 能 充 4 | 
解 某 些 名 词 ， 将 是 非常 有 帮助 的 。 因 为 在 汉语 中 ， 不 仅仅 表 音 ， 

能 从 词语 组 合 中 体会 到 该 术语 的 含义 。 比 如 “激光 ”"， 这 是 汉语 。 器 光 
是 从 “light amplification by stimulated emission of radiation” 出 来 

的 laser”"”， 它 是 一 个 造 出 来 的 词 ， 因 为 此 前 人 们 不 知道 在 那 种 条 wy 
发 出 来 的 是 什么 。 但 是 汉语 不 然 ， 反 正 用 一 个 “ 光 ” 束 可 以 概括 了 ， 

不 过 这 个 “ 光 " 不 是 传统 概念 中 的 * 光 ”， 而 是 由 于 “ 受 激 ” 辐 射 得 到 的 
光 ， 故 名 “激光 ”。 是 不 是 汉语 很 牛 ? 


和 迭 ” 在 汉语 中 的 意思 是 “屡次 ， 反 复 ”， 如 高 潮 友 起 。 跟 * 代 ”组 合 束 可 
1 反复 外 十 丰 是 月 忌 : 子 子孙 孙 ' 的 意思 了 ? “结婚 -生子 - 
和 昌 你 是 不 是 也 在 这 个 “交代 ”的 过 程 中 
呢 ? 


给 个 稍微 严格 的 定义 ， 来 目 维基 百科 : “迭代 是 重复 反馈 过 程 的 活动 ， 
其 目的 通常 是 为 了 接近 并 到 达 所 需 的 目标 或 结 宁 。” 

某 些 类 型 的 对 象 是 “可 迭代” (iterable) 的 ， 但 如 何 判断 一 个 对 象 是 不 
是 可 迭代 的 ? 下 面 演 示 一 种 方法 (事实 上 还 有 别 的 方式 ) : 


>> astr = "python" 


>>> hasattr(astr,'_ iter_ _') 


False 


这 里 用 内 建 画 数 hasattr0 判 断 一 个 字符 串 是 否定 可 迭代 的 ， 返 回 了 
False。 用 同样 的 方式 可 以 判断 : 


> lst"= [LT;2] 
>>> hasattr(alst,'_ iter_ _') 
True 


>>> hasattr(3, '__iter__') 


False 


hasattr0 的 判断 本 质 融 是 看 那个 类 型 中 是 否 有 _ iter 函数。 读者 可 以 
用 dir0 找 一 找 ， 在 数字 、 字 符 串 、 列 表 中 谁 有 __iter “ 函 数 。 同 样 还 可 
找 一 找 dict、tuple 两 种 类 型 对 象 是 否 含有 这 个 方法 。 


以 上 穿插 了 一 个 新 的 概念 *iterable” (可 迭代 的 ) ， 现 在 回 到 extend 
上 ， 这 个 函数 需要 的 参数 就 是 iterable 类 型 的 对 象 。 


LE python", "qliwsir’. 17" 2, 8] 


>>> new 


通过 extend 函 数 ， 将 [1，2，3] 中 的 每 个 元 素 都 拿 出 来 ， 然 后 塞 到 ]st 里 
面 ， 从 而 得 到 一 个 跟 原 来 的 对 象 元 素 不 一 样 的 列表 ， 比 原来 的 多 了 三 
个 元 素 。 上 面 说 得 有 点 哆 喧 ， 只 不 过 是 为 了 把 过 程 完 整 表 达 出 来 。 


从 上 面 的 演示 中 可 以 看 出 ，1lst 经 过 extend 函 数 操 作 之 后 ， 变 成 了 一 个 
觅 似 < 新 ”的 列表 。 


new = [1,2,3] 
>>> id(new) 
3072383244L 


>>> lst = ['python', 'qgiwsir'] 
>>> id(lst) 


3069501420L 


用 id0 能 够 看 到 两 个 列表 分 别 在 内 存 中 的 “ 离 ” 的 编号 。 


>>> lst.extend(new) 

>o52 18t 

E:python 5 “qiwsir'i 17 2-3] 
>>> id(lst) 


3069501420L 


虽然 lst a i 但 是 ， 并 没有 离开 原来 
的 “ 寅 >， 即 在 内 存 中 还 是 “ 卓 " 的 ， 只 不 过 里 面 的 内 容 增多 了 “。 相 当 于 


两 口 之 家 ， 经 过 一 番 云 雨 之 后 ， 义 增加 了 一 个 小 宇 宇 ， 那 么 这 个 家 
是 “新 ”的 还 是 “ 旧 ” 的 呢 ? 角度 不 同 或 许 说 法 不 一 。 


这 如 是 列表 的 一 个 重要 特征 : 列表 是 可 以 修改 的 。 这 种 修改 ， 不 是 复 
制 一 个 新 的 ， 而 是 在 原 地 进行 修改 。 


其 实 ，append() 对 列表 的 操作 也 是 如 此 ， 不 妨 用 同样 的 方式 看 看 。 


说 明 : 虽然 这 里 的 lst 内 容 和 上 面 的 一 样 ， 但 是 ， 重 新 在 shell 中 输入 id 
会 变化 。 也 就 是 内 存 分 配 的 “ 离 ?的 编号 变 了 。 


>>> lst = ['python'，qiwsir '] 
Sow idkdlst) 

3069501388L 

>>> lst.append(new) 

> "LS8t 

[py LEwslF T1725.:3]9 
>>> id(1st) 


3069501388L 


显然 ，append0 也 是 原 地 修改 列表 。 
如 果 对 于 extend0 提 供 的 不 是 iterable 类 型 对 象 ， 会 如 何 呢 ? 


>>> lst.extend("itdiffer") 
>>> lst 


[python'，'qiwsir' td i', 'f', 'f', 'e', 'r'] 


它 把 一 个 字符 串 "itdiffer" 转 化 为 [六 ， 已， 'd i 中 ， fe 'e", 'r']， 然后 
将 这 个 列表 作为 参数 ， 提 供给 extend， 并 将 列表 中 的 元 素 塞 入 原来 的 
列表 中 3 
>>> num_lst = [1,2,3] 
>>> num_lst.extend(8) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: 'int' object is not iterable 


这 就 报错 了 。 错 误 提 示 告 诉 我 们 ， 那 个 数字 8 是 int 类 型 的 对 象 ， 不 是 
iterable 的 。 


这 里 讲述 两 个 让 列表 扩容 的 函数 append0 和 extend0， 总 结 其 共同 点 : 


。 都 是 原 地 修改 列表 。 
。 既然 是 原 地 修改 ， 束 不 返回 值 。 


原 地 修改 没有 返回 值 ， 束 不 能 赋值 给 某 个 变量 。 


>>> one = ["good", "good", "study"] 


>>> another = one.extend(["day", "day", "up"]) # 没 有 返回 值 


>>> another # 这 样 的 ， 什 么 也 没有 得 到 。 
>>> One 


['good', 'good', 'study', 'day', 'day', 'up'] 


那么 两 者 有 什么 不 一 样 呢 ? 再 看 下 面 的 例子 之 前 ， 读 者 能 不 能 通过 前 
面 的 操作 总 结 一 下 ? 请 融 代 码 尝试 ， 然 后 看 下 面 的 例子 : 


>>> 1st = [1,2,3] 

>>> lst.append(["qiwsir","github"]) 

>>> lst 

[1, 2, 3, ['qiwsir', 'github']] #append 的 结果 
>>> len(lst) 


4 


>>> lst2 = [1,2,3] 

>>> lst2.extend(["qiwsir","github"]) 

>>> lst2 

[1, 2, 3, 'qiwsir', 'github'] #extend 的 结果 
>>> len(lst2) 


5 


append 是 整 建制 地 追加 ，extend 是 个 体 化 扩编 。 
2.count 


count 的 作用 是 数 一 数 某 个 元 素 在 该 list 中 出 现 多少 次 ， 也 束 是 某 个 元 素 
有 多 少 个 。 官 方 文 档 是 这 么 说 的 : 


list.count(x) 


Return the number of times x appears in the list. 


一 定 要 不 断 实验 才能 理解 文档 中 精炼 的 表达 。 


| 
>>> la.count(1) 
3 


>>> la.append('a') 


>>> la.append('a') 
>>> a 
[1, 2, 1, 1, 3, 'a', 'a'] 


>>> la.count('a') 


2 
>>> la.count(5) #1a 中 没有 5， 但 是 不 报错 ， 返 回 的 是 数字 0 
0 

3.index 


前 面 已 经 讲 过 ， 不 次 述 ， 但 是 为 了 完整 ， 也 占 个 位 置 吧 。 


Lt ar NO] 


>>> la.index(3) 


>>> la.index('qi') # 如 果 不 存 在 ， 就 报错 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


ValueError: 'qi' is not in list 


依然 是 上 一 条 官方 解释 ， 主 要 目的 是 熟悉 看 文档 : 


list.index(x) 


Return the index in the list of the first item whose value is x. It is an error if there is no Such itenm. 


征 不 是 说 得 非常 清楚 明日 了 ? 如 采 没 有 搞 清楚 ， 赶 快 学 英语 吧 。 示 
来 ， 如 果 在 写 代 码 这 个 职业 上 发 展 ， 英 语 是 绕 不 开 的 。 


4.insert 


除了 向 列表 中 追加 元 素 ， 在 现实 中 ， 还 应 该 有 “插入 ”。Python 提 供 了 
这 样 的 操作 ，list.insert (i，x) 束 是 辐 列表 插入 元 素 的 函数 。 


如 果 学 会 了 看 官方 文档 ， 则 学 习 任何 语言 都 是 小 菜 一 碟 了 。 继 续 看 
Python 官 方 文档 是 如 何 解 释 insert() 的 : 


list.insert(i, x) 


Insert an item at a given position. The first argument is the index of the element before which to insert, so a.insert 
(0, x) inserts at the front of the list, and a.insert(len(a), x) is equivalent to a.append(x). 


根据 官方 文档 的 说 明 ， 我 们 做 下 面 的 实验 ， 请 读者 从 实验 中 理解 : 


>>> all_users 


['qiwsir', 'github', 'io'] 

>>> all users.insert("python") 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: insert() takes exactly 2 arguments (1 given) 


a 提示 信息 ，insert0 应 该 供给 两 个 参数 ， 但 是 这 里 只 给 
， 所 以 报错 没商量 啦 。 


>>> all users.insert(0, "python") 
>>> all_users 


['python', 'qiwsir', 'github', 'io'] 
>>> all_users.insert(1, "http://") 


>>> all_users 


['python', 'http://', ‘qiwsir', 'github', 'io'] 


list.insert (i，x) 中 的 i 是 将 元 素 x 插 入 到 列表 中 的 位 置 ， 即 将 x 插入 到 
索引 值 是 i 的 元 素 前 面 。 注 意 ， 索 引 是 从 0 开始 的 。 


有 一 种 操作 挺 有 意思 的 ， 如 下 : 


>>> length = len(all_users) 


>>> length 

5 

>>> all_users.insert(length, "algorithm") 
>>> all_users 


['python', 'http://', 'qiwsir', 'github', 'io', 'algorithm'] 


在 原来 的 all_users 中 ， 最 大 索引 值 是 4， 如 果 要 all_users.insert 
(5，"algorithm") ， 则 表示 将 ' oe a ee 但 
是 没有 。 换 个 说 法 ，5 前 面 就 是 4 的 后 面 。 所 以 ， 束 是 追加 了 。 


其 实 ， 还 可 以 这 样 : 


| 
>>> a.insert(9, 777) 
>>> a 


[1, 2, 3, 777] 


也 束 是 说 ， 如 采 过 到 那个 记 经 超过 了 最 大 索引 值 ， 会 目 动 将 所 要 插入 
的 元 素 放 到 列表 的 尾部 ， 即 追加 。 


5.pop 和 remove 
对 列表 ， 不 仅 能 增加 元 素 ， 还 能 被 删除 之 。 删 除 元 素 的 方法 有 两 个 ， 


它们 分 别 是 : 
。 list.remove (x) 


Remove the first item from the list whose value is X.It is an error if there js 
no such item. 


。 list.pop ([i]) 


Remove the item at the given position in the list, and return it.If no index 
is specified, a.popOremoves and returns the last item in the list. (The 
square brackets around the i in the method signature denote that the 
parameter is optional, not that you should type square brackets at that 
position.You will see this notation frequently in the Python Library 
Reference.) 


我 学 习 Python 有 一 个 习惯 ,就 是 用 学 习 物 理 的 方法 来 学 习 。 不 知道 读 
者 的 物理 学 得 怎么 样 ? 如 采 当 初 没 有 学 好 也 不 用 担心 ， 跟 着 我 的 思路 
走 ， 不 仅 能 学 好 Python， 还 能 学 好 物理 。 物 理 中 有 一 个 非常 重要 的 人 研 
完 和 学 习 方 法 ， 先 实验 ， 然 后 总 结 规 律 。 


人 读者 回味 一 下 前 面 的 内 容 ， 是 不 是 隐隐 人 然 有 所 感受 
呢 ? 


先 实验 listremove (x) ， 这 是 一 个 能 够 删除 list 元 素 的 方法 ， 同 时 上 面 
引用 的 官方 说 明 告 诉 我 们 ， 如 果 x 没 有 在 list 中 ， 就 会 报错 。 


>>> all_users 


[ "python'， 'http://', 'qiwsir', 'github', 'io', 'algorithm'] 
>>> all_ users.remove("http://") 
>>> all_users 


['python', 'qiwsir', 'github', 'io', 'algorithm'] 


>>> all_users.remove("tianchao") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


ValueError: list.remove(x): x not in list 


>>> lst = ["python", "java", "python", "c"] 
>>> lst.remove("python") 


>>> lst 


在 第 三 段 实 验 中 ， 列 表 内 有 两 个 'python' 字 符 串 ， 当 删除 后 ， 发 现 结 采 
只 删除 了 第 一 个 python' 字 符 串 ， 第 二 个 还 在 。 原 因 何 在 ? 请 仔细 看 前 
面 的 文档 说 明 : remove the first item...。 


y+ = 
注 局 \: 


。 如果 正确 删除 ， 不 会 有 任何 反馈 。 没有 消 忆 就 是 好 消 居 ， 因 为 古 
对 列表 进行 原 地 修改 。 
。 如果 所 删除 的 对 象 不 在 list 中 ， 就 报错。 注意 阅读 报错 信息 : x not 


in list ° 


读者 在 阅读 的 时 候 如 果 没 有 关注 某 些 细 市 ， 往 往 束 失去 了 本 书 的 某 些 
精华 ， 比 如 我 在 前 面 的 很 多 操作 中 ， 都 使 用 了 一 个 名 为 lst 的 变量 ， 而 
不 是 用 list， 为 什么 呢 ? 因为 list 是 Python 的 保留 字 。 

什么 是 保留 字 ? 在 Python 中 ， 某 些 词语 或 者 拼写 是 不 能 被 用 户 拿 来 做 
变量 、 函 数 、 类 等 命名 ， 因 为 它们 已 经 被 语言 本 里 完 占 用 了 。 这 些 束 
I 于 变 成 任何 命 
and, assert, break, class, continue, def, del, elif, else, except, 


exec, finally, for, from, global, if, import, in, is, lambda, not, 
or, pass, print, raise, return, try, while, with, yield 


这 些 保留 字 都 是 我 们 在 编程 中 要 用 到 的 ， 有 的 你 已 经 在 前 面 遇 到 了 。 


如 采 能 够 在 执行 删除 之 前 ， 先 判断 列表 中 是 否 有 那个 对 象 ， 有 了 再 
删 ， 没 有 束 别 费事 了 ， 有 十 不 是 更 显 出 程序 的 智能 程度 高 呢 ? 


这 的 确 是 一 个 不 错 的 想法 。 你 觉得 应 该 如 何 实现 ? 


['python', 'qiwsir'， 'github', "io'，" algorithm'] 


>>> " python" in all_users # 用 in 来 判断 是 否 在 list 中 


>>> if "python" in all users: 
all_users.remove("python") 
print all_users 
“3 


print "'python' is not in all users" 
['qiwsir', 'github', 'io', 'algorithm'] # 删除 了 "python" 元 素 


>>> if "python" in all users: 
all_users.remove("python") 
print all_users 
二 


上 述 代码 ， 就 是 两 段 小 程序 ， 我 是 在 交互 模式 中 运行 的 ， 相 当 于 小 实 

验 。 这 里 其 实用 了 一 个 后 面 才 会 讲 到 的 东西 ，iEelse 语 句 。 不 过 ， 我 沉 

得 即使 没有 学 习 ， 你 也 能 看 懂 ， 因 为 它 非常 接近 自然 语言 了 

精力 旺盛 的 读者 还 可 以 将 上 面 的 问题 编写 成 一 段 小 程序 单独 运行 。 

玉芝 看 另外 一 个 副 除 srpop (J) 的 程序 方法 还 是 ， 看 看 文档 ， 全 
实验 。 


>>> all_users 


['qiwsir', 'github', 'io', '"'algorithm'] 
>>> all_users.pop() #1ist ,pop( [i] ), 圆 括号 里 面 是 [i] ， 表 示 这 个 序号 是 可 选 的 
'algorithm' # 默 认 删 除 最 后 一 个 ， 并 且 将 该 结果 返 匠 


>>> all_users 


[qiwsir gtithub5 "io0°] 
>>> all_users.pop(1) # 指 定 删除 编号 为 1 的 元 素 "github" 
"github 


>>> all_users 
['qiwsir', 'io'] 
>>> all_users.pop() 


'io!' 


>>> all_users # 只 有 一 个 元 素 了 ， 该 元 素 编号 是 9 
['qiwsir'] 
>>> all users.pop(1) # 但 是 非 要 删除 编号 为 1 的 元 素 ， 结 果 报 错 。 


Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


IndexError: pop index out of range 


list.remove (x) 中 的 参数 是 列表 中 元 素 ， 即 删除 某 个 元 素 ; list.pop 
(器 ) 中 的 是 列表 中 元 素 的 索引 值 ， 这 个 用 方 括 号 包 庄 起来， 意味 着 
还 可 以 不 写 任何 索引 值 如 上 面 的 操作 结果 ， 就 是 删除 列表 的 最 后 一 
| O 


留 一 个 思考 题 ， 如 采 要 像 前 面 那样 ， 能 不 能 事先 判断 一 下 要 删除 的 编 
号 是 不 是 在 list 的 长 度 范围 〈 用 len (list) 获取 长 度 ) 以 内 ， 然 后 进行 
删除 或 者 不 删除 操作 ? 


6.reverse 


reverse 比 较 人 简单 ， 就 古 把 列表 的 元 素 顺 序 反 过 来 。 


>>> a = [8,5;16] 


注意 ， 十 原 地 反 过 来 ， 不 是 另外 生成 一 个 新 的 列表 ， 所 以 ， 它 没有 返 
回 值 。 跟 这 个 类 似 的 有 一 个 内 建 钞 数 reversed， 建 议 读者 了 解 一 下 这 个 
函数 的 使 用 方法 。 


因为 listreverse0 不 返回 值 ， 所 以 不 能 实现 对 列表 的 反 回 迭代 ， 如 果 要 
这 人 么 做 ， 可 以 使 用 reversed 函 数 。 


7.sort 


sort 是 对 列表 进行 排序 。 文 档 中 是 这 么 写 的 : 


L.sort(cmp=None, key=None, reverse=False) -- stable sort IN PLACE; cmp(x, y) -> -1, 0, 1 


list.sort0 也 是 让 列表 进行 原 地 修改 ， 没 有 返回 值 。 默 认 情 况 如 上 面 的 
操作 ， 实 现 的 是 从 小 到 大 的 排序 。 


这 样 ， 实 现 了 从 大 到 小 的 排序 。 
在 前 面 的 画 数 说 明 中 ， 还 有 一 个 参数 key， 这 个 怎么 用 呢 ? 不 知道 你 是 


否 玖 悉 电子 表格 ， 能 够 设置 按照 某 个 关键 字 进 行 排序 。Python 当 然 不 
会 比 电 子 表格 弱 。 


= Lot [python Javea "eo" "pascal" basico] 


这 是 以 字符 串 的 长 度 为 天 键 词 进行 排序 的 。 


对 于 排序 ， 还 有 一 个 更 为 党 用 的 内 建 画 数 sorted， 读 者 可 以 去 研究 一 
番 ， 并 且 比 较 一 下 两 种 排序 的 各 目 特 点 。 


顺便 指出 ， 排 序 古 一 个 非常 有 人 研究 价值 的 话题 ， 不 仅仅 是 这 一 个 男 
数 。 有 兴趣 的 读者 可 以 去 网 上 搜 一 下 与 排序 相关 的 知识 。 


1.8 比较 列表 和 字符 串 

列表 和 字符 串 两 种 对 象 类 型 有 不 少 相 似 的 地 方 ， 也 有 很 大 的 区 别 。 有 
必要 对 它们 做 个 简要 的 比较 ， 以 便 能 深刻 理解 ， 此 外 也 是 复习 ，“ 温 故 
而 知 新 ”。 

1.8.1 相同 点 

两 者 都 属于 序列 类 型 ， 由 此 ， 那 些 属 于 序列 的 操作 对 两 者 都 适用 。 
在 对 序列 类 型 理解 的 基础 上 ， 用 趋 于 专业 的 语言 接 述 ， 它 的 每 一 个 元 
素 都 可 以 通过 指定 一 个 编号 ( 行 话 叫 做 “ 偏 移 量 * 或 者 “索引 值 ”*) 的 方 


式 得 到 ， 而 要 想 一 次 得 到 多 个 元 素 ， 可 以 使 用 切片 。 偶 移 量 或 者 索引 
值 从 0 开始 ， 到 总 元 素数 减 1 结束 。 


>>> welcome_str = "Welcome you" 


>>> welcome_str[0] 


>>> welcome_str[len(welcome_str) - 1] 


>>> welcome_str[:4] 
"Welc' 

>>> a = "python" 
2%3 a * 及 


'pythonpythonpython' 


Su lt list = ["qiwsir" gtthub "40"] 
>>> git_list[0] 

"qiwsir' 

>>> git_list[len(git_list) - 1] 

ii0 

>5% Wit List[d:2] 

['qiwsir', 'github'] 

>>> b = ['qiwsir'] 

wx 7 


['qiwsir', 'qiwsir', 'qiwsir', 'qiwsir', 'qiwsir', 'qiwsir', 'qiwsir'] 


还 有 一 些 操作 是 类 似 的 : 


>>> first = "hello,world" 
>>> welcome_str 

'Welcome you' 

>>> first+","+welcome_str 


'hello, world,Welcome you' 


>>> language = ['python'] 
>>> git_list 

['qiwsir', 'github', 'io'] 
>>> language + git_list 


['python', 'qiwsir', 'github', 'io'] 
>>> len(welcome_str) 
4 


>>> len(git_list) 


其 他 关于 序列 的 基本 操作 ， 此 处 不 再 重复 。 
1.8.2 ”区别 
列表 和 字符 串 的 最 大 区 别 是 ， 列表 是 可 以 改变 ， 字 符 串 不 可 变 。 


首先 看 对 列表 的 这 些 操 作 ， 其 特点 十 在 原 处 将 列表 进行 了 修改 : 


> Qt list 


['qiwsir', 'github', 'io'] 


>>> git_list.append("python") 
>>> git_list 


['qiwsir', 'github', 'io', 'python'] 


>>> git_list[1 
'github' 
>>> git_list[1] = 'github.com' 


>>> git_list 


['qiwsir', 'github.com', 'io', 'python'] 


>>> git_list.insert(1, "algorithm") 
>>> git_list 


['qiwsir', 'algorithm', 'github.com', 'io', 'python'] 


>>> git_list.pop() 


'python' 


>>> del git_list[1] 
>>> git_list 


['qiwsir', 'github.com', 'io'] 


以 上 这 些 操 作 ， 如 采用 在 str 上 都 会 报错 ， 比 如 : 


>>> welcome_str 


“Welcome you' 


>>> welcome_str[1]="'E" 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: 'str' object does not support item assignment 


>>> del welcome_str[1] 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: 'str' object doesn't support item deletion 


>>> welcome_str.append("E") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


AttributeError: 'str' object has no attribute 'append ' 


如 果 要 修改 一 个 str， 不 得 不 这 样 。 


>>> welcome_str 
'Welcome you' 
>>> welcome_str[0]+"E"+welcome_str[2:] # 重 新 生成 一 个 str 


'WElcome you' 


>>> welcome_str # 对 原来 的 没有 任何 影响 


'Welcome you' 


其 实 ， 在 这 种 做 法 中 束 是 重新 生成 了 一 个 str。 
1.8.3 ”多维 列表 


在 字符 串 中 ， 每 个 元 素 只 能 是 字符 ， 在 列表 中 ， 元 素 可 以 是 任何 类 
型 。 前 面 见 到 的 大 多 是 数字 或 者 字符 ， 其 实 还 可 以 这 样 : 


>>> matrix = [[1,2,3],[4,5,6],[7,8,9]] 


>>> matrix = [[1,2,3],[4,5,6],[7,8,9]] 


>>> matrix[9][1] 

2 

So MULE = [L278 a Db ed] 
>>> mult 


[[1, 2, 3], ['a', 'b', 'c'], 'd', 'e'] 


>>> mult[1][1] 


> 
1b， 
>>> mult[2] 
d 


以 上 显示 了 多 维 列表 以 及 访问 方式 。 在 多 维 的 情况 下 ， 里 面 的 列表 被 
当成 一 个 元 素 对 待 。 


1.8.4 ”列表 和 字符 串 的 互相 转化 

以 下 涉及 split0 和 join0 两 个 函数 ， 在 前 面 字 符 串 部 分 已 经 见 过 。 一 回 
生 ， 二 回 熟 ， 特 别 是 在 已 经 学 习 0 应 该 有 更 深刻 
的 理解 。 

str.split() 

这 个 内 置 函 数 实现 的 是 将 str 转 化 为 list。 其 中 str=" 是 分 隅 符 。 

请 先 在 交互 模式 下 做 如 下 操作 : 


>>>help(str.split) 


得 到 了 对 这 个 内 置 函 数 的 完整 说 明 。 特 别 强调 : 这 是 一 种 非常 好 的 学 
J \ 本 书 的 特色 就 是 教 给 读者 一 些 方法 ， 所 谓 “ 授 人 以 鱼 不 如 授 人 
此 渔 ” 各 


split (...) S.split ([sep[, maxsplit]]) ->list of strings 


Return a list of the words in the string S$, using sep as the delimiter 
string.If maxsplit is given, at most maxsplit splits are done.If sep is not 
specified or is None, any whitespace string is a separator and empty 
strings are removed from the result. 


不 管 是 否 看 懂 上 面 这 段 话 ， 都 来 看 一 下 例子 。 


>>> line = "Hello.I am qiwsir.Welcome you." 
>>> line.split(".") # 以 英文 的 句点 为 分 隔 符 
['Hello', 'I am qiwsir', 'Welcome you', ''] 


# 这 个 1 就 是 表达 了 官方 文档 中 的 : If maxsplit is given，at most maxsplit splits are done. 


>>> line.split(".",1) 
['Hello', 'I am qiwsir.Welcome you.'] 
>>> name = "Albert Ainstain" # 也 有 可 能 用 空格 作为 分 隔 符 


>>> name.split(" ") 


['Albert', 'Ainstain'] 


下 面 的 例子 ， 让 你 更 有 点 惊奇 了 。 


>>> s = "I am writing\npython\tbook on line" 


# 这 个 字符 串 中 有 空格 、 喜 号 、 换 行 \n、tab 缩 进 \t 符号 


>>> print s 
I am, writing 
python book on line 


>>> s.split() # 用 split( ), 但 是 括号 中 不 输入 任何 参数 


['I', ‘'am,', 'writing', 'python', 'book', 'on', 'line'] 


如 果 split0) 不 输入 任何 参数 ， 显 示 束 是 见 到 任何 分 割 符号 ， 束 用 其 分 割 
了 了 0 


1.8.5 [so] ii (ist) 


join 可 以 说 是 split 的 逆 运 算 ， 举 例 : 


>>> name 


['Albert', 'Ainstain'] 


>>> "".join(name) 
'AlbertAinstain' 
>>> ".".join(name) 


"Albert .Ainstain' 
>>> " " .join(name) 


"Albert Ainstain' 


回 到 上 面 那个 神奇 的 例子 中 ， 可 以 这 样 使 用 join.: 


>>> s = "I am writing\npython\tbook on line" 
>>> print s 

I am, writing 

python book on line 


sw S501lit(} 


['I', 'am,', 'writing', 'python', 'book', 'on', 'line'] 
>>> " ".join(s.split()) # 重 新 连接 ， 不 过 有 一 点 遗憾 ，am 后 面 豆 号 还 是 有 的 。 
# 怎 么 去 掉 ? 


'I am, writing python book on 1Line' 


1.9 元 组 
1 本] 定义 
先 看 一 个 例子 : 


>>> # 变 量 引 用 str 
> § = "abe" 
> 


"abc 


>>># 如 果 这 样 写 ， 就 会 是 . . . 
>>> t = 123, 'abc', ["come","here"] 
ww 


(123, 'abc', ['come', 'here']) 


上 上面 例子 中 并 没有 报错 ， 也 没有 “最 后 一 个 有 效 ”， 而 是 将 对 象 作为 一 
个 新 类 型 : tuple 〈 元 组 ) ， 赋 值 给 了 变量 t。 


元 组 是 用 加 括号 括 起 来 的 ， 元 素 之 间 用 逗号 隔 开 。 (特别 提醒 ， 不 管 
是 圆 括号 还 是 逗号， 都 是 英文 半角 的 。 这 个 并 非 杞 人 忧 天 ， 不 知道 什 
么 原因 ， 很 多 敲 代码 的 朋友 居然 把 自己 的 电脑 默认 输入 方式 为 中 文 ， 
结果 常常 在 代码 中 插入 全 角 符号 。) 


元 素 中 的 元 素 可 以 是 任何 Python 对 象 类 型 。 


其 实 ， 你 不 应 该 对 元 组 陌生， 前 面 讲述 字符 串 的 格式 化 输出 时 ， 有 这 


>>> print "I love %s, and I am a %s" % ('python', "programmer ' ) 


I love python, and I am a programmer 
这 里 的 圆 括号 束 是 一 个 元 组 。 


元 组 也 是 一 种 序列 ， 这 一 点 与 列表 、 了 字符 串 类 似 。 它 的 特点 就 是 其 中 
的 元 素 不 能 更 改 ， 这 一 点 与 列表 不 同 ， 倒 是 跟 字 符 串 类 似 ; 它 的 元 素 
又 可 以 是 任何 类 型 的 数据 ， 这 一 点 与 列表 相同 ， 但 不 同 于 字符 串 。 


>>> t = 1,"23",[123,"abc"], ("python", "learn") # 元 素 多 样 性 ， 近 list 
Se 


(1, '23', [123, 'abc'], ('python', 'learn')) 


>>> t[9] = 8 # 不 能 原 地 修改 ， 近 str 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: 'tuple' object does not support item assignment 


>>> t.append("no") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


AttributeError: 'tuple' object has no attribute 'append ' 


从 上 面 的 简单 比较 似乎 可 以 认为 ， 元 组 就 是 一 个 融合 了 部 分 列表 和 部 
分 字符 串 属性 的 杂交 产物 。 


1.9.2 ”索引 和 切片 


前 面 有 了 关于 列表 和 字符 串 的 知识 基础 ， 它 们 都 古 序列 类 型 ， 元 组 也 
苹 。 因 此 ， 元 组 的 基本 操作 和 它们 是 一 样 的 。 


例如 : 


>>> t 

(1, '23', 
>>> t[2] 
[123; "abc"] 
wm 
(23 L123, abc ls {Python 
>>> t[2][9] 
123 

>>> t[3][1] 


"Learn' 


[123, 'abc'], ('python', 


'learn')) 


'learn')) 


# 还 能 这 样 呀 ， 哦 ， 对 了 ，1ist 中 也 能 这 样 


关于 序列 的 基本 操作 在 元 组 上 的 表现 就 不 一 一 展示 了 ， 读 者 自行 调试 


吧 。 


但 是 这 里 要 特别 提醒 ， 如 果 一 个 元 组 中 只 


一 个 元 素 ， 应 该 在 该 元 素 


后 面 加 一 个 半角 的 英文 逗号 。 


>>> a= (3) 
>>> type(a) 


<type 'int'> 


wn BD (3..}) 
>>> type(b) 


<type 'tuple'> 


如 采 不 加 那个 逗号 束 不 是 元 组 ， 加 了 才 和 是 ， 这 也 是 为 了 避免 让 Python 
误解 你 要 表达 的 内 容 。 


列表 和 元 组 之 间 可 以 实现 转化 ， 分 别 使 用 list0 和 tupleO0 实 现 。 


wi 

fie 23 Li29 “abel fpython®: 
> tl15 = list(t) 

>>> tls 

[1, '23', [123, 'abc'], ('python' 


>>> t_tuple = tuple(tls) 


>>> t_tuple 


(1, '23', [123, 'abc'], 


1.9.3 用途 


('python’', 


'learn')) 


#tuple-->list 


'learn')] 


#1ist-->tuple 


'learn')) 


既然 元 组 古 列 表 和 字符 串 的 杂 合 ， 那 么 它 有 什么 用 途 呢 ?不 是 用 列表 
和 字符 串 束 可 以 了 吗 ? 


有 些 情 况 只 需要 列表 和 字符 串 ， 但 是 ， 世 界 是 复杂 的 ， 我 们 要 解决 的 
问题 不 全 是 简单 问题 ， 束 如同 目 然 语 言 一 样 ， 虽然 有 的 词汇 看 似 可 有 
可 无 ， 用 别 的 也 能 蔡 换 之 ， 但 我 们 依然 要 在 某 些 情况 下 使 用 它们 。 


一 般 认为 元 组 有 这 些 特点 ， 并 且 也 是 它 使 用 的 情景 : 


元 组 比 列 表 操 作 速 度 快 。 如 果 定 义 了 一 个 值 的 常量 集 ， 并 且 唯 一 
要 用 它 做 的 是 不 断 地 凯 历 (遍历 是 一 种 操作 ， 读 者 可 以 看 后 面 的 
for 循 环 ) 它 ， 请 使 用 元 组 代替 列表 。 

如 果 对 不 需要 修改 的 数据 进行 “ 写 保 护 ”， 可 以 使 代码 更 安全 ， 这 
时 使 用 元 组 而 不 是 列表 。 如 果 必 须要 改变 这 些 值 ， 则 需要 执行 元 
组 到 列表 的 转换 。 

元 组 可 以 在 字典 ( 男 外 一 种 对 象 类 型 ， 请 参考 后 面 的 内 容 ) 中 被 
用 作 key， 但 是 列表 不 行 。 因 为 字典 的 key 必 须 是 不 可 变 的 ， 元 组 
本 吴征 不 可 改变 的 。 

。 元 组 可 以 用 在 字符 串 格 式 化 中 。 


1.10 字典 


你 现在 还 用 字典 吗 ? 随 着 网 络 的 发 展 ， 用 字典 的 人 越 来 越 少 了 ， 不 少 
人 习惯 于 在 网 上 搜索 "在 很 入 以 前 ， 我 曾 拥有 一 本 小 小 的 《新 华 字 


人 人 


《新 华 字 典 》 是 中 国 第 一 部 现代 汉语 字典 ， 最 早 的 名 字 叫 《 伍 记 小 字 
典 》， 但 未 能 编纂 完成 。 目 1953 年 ， 开 始 重 编 ， 其 凡 例 完 全 采用 《 伍 
记 小 字典 》。 从 1953 年 开始 出 版 ， 经 过 反复 修订 ， 但 是 以 1957 年 商务 
印 书馆 出 版 的 《新 华 字 p 典 》 作 为 第 一 版 。 由 原 新 华 辞 书社 编写 ，1956 
年 并 入 中 科 院 语言 研究 所 〈 现 中 国 社 科 院 语言 研究 所 ) 词典 编辑 室 ， 

新 华 字 典 由 商务 印 书馆 出 版 。 历 经 几 代 上 百名 专家 学 者 10 余 次 大 规模 
修订 ， 重 印 200 多 次 。 成 为 迄今 为 止 世界 出 版 史上 发 行 量 最 高 的 字典 。 


在 这 里 讲 到 字典 ， 不 是 为 了 回忆 ， 而 是 提醒 读者 想 想 我 们 如 何 使 用 字 
典 : 先 查 索引 ， 然 后 通过 索引 找到 相应 内 容 ， 不 用 从 头 开 始 一 页 一 页 
地 找 ， 这 种 方法 能 够 快捷 地 直达 目标 。 

正 是 基于 这 种 需要 ，Python 中 有 了 一 种 叫 作 dictionary 的 对 象 类 型 ， 翻 
译 过 来 束 是 “字典 *， 用 dict 表 示 。 


假设 有 一 种 需要 ， 要 存储 城市 和 电话 区 号 ， 苏 州 的 区 号 是 0512， 唐 山 
的 是 0315， 北 京 的 是 011， 上 海 的 是 012。 用 前 面 已 经 学 习 过 的 知识 ， 
可 以 这 样 来 做 : 


>>> citys = ["suzhou", "tangshan", "beijing", "shanghai"] 


>>> city_codes = ["0512", "6315", "611", "012"] 


用 一 个 列表 来 存储 城市 名 称 ， 然 后 用 另外 一 个 列表 一 一 对 应 地 保存 区 
号 。 假 如 要 输出 苏州 的 区 号 ， 可 以 这 样 做 : 


>>> print "{0} : {1}".format(citys[9]，city_codes[9]) 


suzhou : 0512 


在 city_codes 中 表示 区 号 的 元 素 没 有 用 整数 型 ， 而 是 使 用 了 字符 串 类 
型 ， 你 知道 为 什么 吗 ? 如 果 用 整数 ， 就 是 这 样 的 : 


>>> suzhou_code = 0512 


>>> print suzhou_code 


330 


怎么 会 这 样 ? 原来 ， 在 Python 中 如 果 按 照 上 面 那 样 做 ，0512 被 认为 是 
一 个 八进制 的 数 ， 用 print 打 印 的 时 候 ， 将 它 转 换 为 了 十 进 制 输出 。 关 
于 进 制 转换 问题 ， 可 以 在 网 上 搜索 一 下 有 关 资 料 ， 此 处 不 详 述 。 一 般 
是 用 几 个 内 建 函 数 实现 : int0)，binO0，oct0，hex0 。 


用 两 个 列表 分 别 来 存储 城市 和 区 号 ， 似 乎 能 够 解决 问题 。 但 是 ， 
是 最 好 的 选择 ， 因 为 Python 还 提供 了 另外 一 种 方案 ， 那 就 是 “字典 


1.10.1 创建 字典 
方法 1: 
创建 一 个 空 的 字典 ， 然 后 可 以 加 入 东西 。 


>>> mydict = {} 
>>> mydict 


{} 
不 要 小 看 “ 空 ” 在 编程 中 ,“ 空 ”是 很 重要 。 
当然 可 以 创建 一 个 不 空 的 字典 : 

>>> person = {"name":"qiwsir", "site":"qiwsir.github.io", "language":"python"} 


{'name': 'qiwsir', 'language': 'python', 'site': 'qiwsir.github.io'} 


"name":"giwsir" 有 一 个 优雅 的 名 字 : 键 值 对 。 前 面 的 name 叫 做 键 

(key) ， 后 面 的 qiwsir 是 前 面 的 键 所 对 应 的 值 (value) 。 在 一 个 字典 
中 ， 键 是 唯一 的 ， 不 能 重复 。 值 则 对 应 于 键 ， 且 值 可 以 重复 。 键 值 之 
间 用 英文 的 冒号 ， 每 一 对 键 值 之 间 用 英文 的 运 号 隅 开 。 


>>> person['name2']="qiwsir" # 增 加 键 值 对 的 方法 


{'name2': 'qiwsir', "name': 'qiwsir', 'language': 'python', 'site': 'qiwsir.github.io'} 


用 这 样 的 方法 可 以 同一 个 字典 中 增加 “ 键 值 对 ”， 那 么 ， 增 加 了 值 之 
后 ， 那 个 字典 对 象 还 是 原来 的 内 存 地 址 吗 ? 即 也 要 探讨 字典 是 否 能 原 


地 修改 ? 《列表 可 以 ， 因 为 列表 是 可 变 的 ;字符 串 和 元 组 都 不 行 ， 因 
为 它们 是 不 可 变 的 ) 。 


>>> ad = {} 

>>> id(ad) 

3072770636L 

>>> ad["name"] = "qiwsir" 
>>> ad 

{'name': 'qiwsir'} 

>>> id(ad) 


3072770636L 


实验 表明 ， 字 典 可 以 原 地 修改 ， 即 它 是 可 变 的 。 
方法 2: 
利用 元 组 建构 字典 ， 方 法 如 下 : 


>>> name = (["first", "Google"], ["second", "Yahoo"]) 
>>> website = dict(name) 
>>> website 


{'second': 'Yahoo', 'first': 'Google'} 


或 者 用 这 样 的 方法 : 


>>> ad = dict(name="qiwsir", age=42) 
>>> ad 


方法 3: 
这 个 方法 ， 跟 以 上 方法 的 不 同 在 于 使 用 fromkeys: 


>>> website = {}.fromkeys(("third","forth"),"facebook") 
>>> website 


{'forth': 'facebook', 'third': 'facebook'} 


符 别 注意 ， 字 典 中 的 “ 键 ”必须 是 不 本 变 寺 象 ，“ 信 可 以 是 任意 类型 
和 对象 。 


S35 三 (2) 
>>> dd 

{(1, 2): 1} 

>>> dd = {[1,2]:1} 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: unhashable type: 'list' 


1.10.2 ”访问 字典 的 值 


字典 类 型 的 对 象 是 以 键 值 对 的 形式 存储 数据 的 ， 所 以 ， 只 要 知道 键 ， 
束 能 得 到 值 ， 这 在 本 质 上 就 是 一 种 映射 关系 。 


映射 ， 就 好 比 “ 物 体 * 和 “影子 ”的 天 系 ,“ 形 影 相 吊 *”， 两 者 之 间 是 映 喘 
关系。 此 外 ， 映 喘 也 是 一 个 严格 的 数学 概念 ， A 是 非 空 集合 。A 到 B 的 
映射 是 指 ，A 中 每 个 元 素 都 对 应 到 B 中 的 茶 个 元 素 。 


既然 是 上 映射， 就 可 以 通过 字典 的 “ 键 ” 找 到 相应 的 “ 值 ”。 


“ 键 ” 很 关键 ， 因 为 通过 “ 键 ” 能 够 增加 “ 值 ”， 通 过 “ 键 ?能 够 改变 “ 值 ”， 通 
过 “ 键 ” 也 能 够 访问 到 “ 值 ”。 


本 小 市 开头 的 城市 和 区 号 的 关系 ， 也 可 以 用 字典 来 存储 和 读 取 。 


>>> city_code = {"suzhou":"0512", "tangshan":"0315", "beijing":"011", "shanghai":"012"} 


> print city_code["suzhou"] 


既然 字典 是 键 值 对 的 上 映射， 就 不 用 考虑 所 请“ 排序 ”问题 了 ， 只 要 通过 
键 束 能 找到 值 ， 至 于 这 个 键 值 对 的 位 置 在 哪里 束 不 用 考虑 了 。 比如 ， 
刚才 建立 的 city_code。 


City_code。 


>> city_code 


{'suzhou': '0512', 'beijing': '911'， 'shanghai': '012'， 'tangshan': '0315'} 


然 这 里 显示 的 和 刚刚 赋值 的 时 候 顺 序 有 别 ， 但 是 不 影响 读 取 其 中 的 


在 列表 中 ， 通 过 索引 值 可 以 得 到 某 个 元 素 。 那 么 在 字典 中 有 索引 吗 ? 
当然 没有 ， 因 为 它 没有 顺序 ， 叉 哪里 来 的 索引 呢 ? 所以， 在 字典 中 整 
不 要 什么 索引 和 切片 了 。 


字典 中 的 这 类 以 “ 键 值 对 ”的 映射 方式 存储 数据 是 一 种 非常 高 效 的 方 
法 ， 比 如 要 读 取 值 的 时 候 ， 如 果 用 列表 ，Python 需 要 从 头 开始 读 ， 直 
到 找到 指定 的 那个 索引 值 。 但 是 ， 在 字典 中 十 通 过 “ 键 ”" 来 得 到 值 ， 要 
高 效 得 多 。 正 是 这 个 特点 ,“ 键 值 对 "这样 的 形式 可 以 用 来 存储 大 规模 
的 数据 ， 因 为 检索 快捷 ， 规 模 越 大 越 明显 。 所 以 ，mongdb 这 种 非 天 系 
型 数据 库 在 大 数据 方面 比较 流行 。 


1.10.3 ”基本 操作 
列举 字典 的 基本 操作 : 
。len (d) ,返回 字典 (d) 中 的 键 值 对 的 数量 。 
。 d[key]， 返 回 字 典 (d) 中 的 键 (key) 的 值 。 
。 d[key]=value， 将 值 (value) 赋 给 字典 (d) 中 的 键 (key) 
。 del d[key]， 删 除 字典 (d) 的 键 (key) 项 (将 该 键 值 对 删除 ) 。 
。 key in d， 检 查 字 典 (d) 中 是 否 含有 键 为 key 的 项 。 


依次 进行 演示 。 


>>> city_code 
"suzhou's: “S512 "beijihng': "Di "shanyhai:: “9t25 ‘tanyshan’': "315 
>>> len(city_code) 


4 


以 city_code 为 操作 对 象 ，len (city_code) 的 值 是 4， 表 明 有 四 组 键 值 
对 ， 也 可 以 说 是 四 项 。 如 采 增 加 项 目 ， 则 |; 


>>> city_code["nanjing"] = "025" 
>>> city_code 


{'suzhou': '0512', 'beijing': '011', 'shanghai': '012'， 'tangshan': '0315', 'nanjing': '025'} 


突然 发 现 北 京 的 区 号 写 错 了 。 可 以 这 样 修改 ， 这 进一步 说 明 字 典 是 可 
4 ,| o 


>>> city_code["beijing"] = "919" 


>>> City_code 


{'suzhou': '6512', 'beijing': '919'，'shanghai' : '912'， 'tangshan': "9315'，'nanjing' : '625'} 


不 仅 北京 的 写 错 了 ， 上 海 的 也 写 错 了 ， 干 脆 删 除 ， 使 用 del， 将 那 一 项 
全 部 删 挥 。 


>>> city_code["shanghai"] 

'012' 

>>> del city_code["shanghai"] 

>>> city_code["shanghai"] 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


KeyError: 'shanghai' 


"shanghai" 的 那个 键 值 对 项 已 经 删除 了 ， 所 以 不 能 找到 ， 用 in 来 看 看 ， 
退回 的 是 False。 


yi shanghai" in city_code 


False 


1.10.4 ”字符 品格 式 化 输出 


字符 串 格 式 化 输出 问题 是 前 面 已 经 存在 的 内 容 ， 这 里 再 次 提 到 是 因为 
用 字典 也 可 以 实现 格式 化 字符 串 的 目的 。 


>>> city_code = {"suzhou":"0512", "tangshan":"0315", "hangzhou":"0571"} 


i Suzhou is a beautiful city, its area code is %(suzhou)s" % city_code 


' Suzhou is a beautiful city, its area code is 0512， 


这 种 写法 非常 简 沪 ， 而 且 很 有 意思 ， 有 人 说 它 很 酷 。 
其 实 ， 更 酷 的 是 下 面 的 一 一 模板 


在 做 网 页 开发 的 时 候 通常 要 用 到 模板 ， 你 只 需要 写 好 HTML 代 码 ， 然 
后 将 某 些 部 位 空 出 来 ， 等 着 Python 后 台 提 供 相应 的 数据 即 可 。 当 然 ， 
下 面 所 演示 的 是 玩具 代码 ， 基 本 没有 什么 实用 价值 ， 因 为 在 真实 的 网 
站 开发 中 ， 这 样 的 知识 很 少 用 。 但 是 ， 它 绝 非 花 拳 绣 腿 ， 而 是 你 能 够 
明了 其 本 质 ， 至 少 了 解 到 一 种 格式 化 方法 的 应 用 。 


>>> temp = "<html><head><title>%(lang)s<title><body><p>My name is %(name)s.</p> </body></head></html>" 


>>> my = {"name":"qiwsir", "lang":"python"} 
>>> temp % my 


'<html><head><title>python<title><body><p>My name is qiwsir.</p></body></head> </html>" 


temp 就 是 所 谓 的 模板 ， 双 引号 所 包 囊 的 实质 上 是 一 段 HTIML 代 码 。 然 
00060 - 些 数 据 ， 按 照 模 板 的 要 求 在 相应 位 置 显示 对 应 的 数 
是 不 是 一 个 很 有 意思 的 层 龙 之 技 ? 

1.10.5 “相关 概念 


以 下 内 容 是 跟 字 典 有 关联 的 基本 知识 ， 从 维基 百科 上 抄录 下 来 ， 供 读 
者 参考 使 用 。 


1. 天 联 数组 
在 计算 机 科学 中 ， 关 联 数组 (英语 : Associative Array) 义 称 映射 
(Map) 、 字 典 (Dictionary) 是 一 个 抽象 的 数据 结构 ， 它 包含 着 类 似 
于 “ 键 值 ”* 的 有 序 对 。 一 个 关联 数组 中 的 有 序 对 可 以 重复 (如 C++ 中 的 
multimap) 也 可 以 不 重复 (如 C++ 中 的 map) 。 
这 种 数据 结构 包含 以 下 几 种 常见 的 操作 : 
(1) 向 关联 数组 添加 配对 。 
(2) 从 关联 数组 内 删除 配对 。 
(3) 修改 关联 数组 内 的 配对 。 
(4) 根据 已 知 的 键 寻 找 配 对 。 
字典 问题 是 设计 一 种 能 够 具备 天 联 数组 特性 的 数据 结构 。 人 解决 字 典 问 
题 的 常用 方法 是 利用 散 列 表 ， 但 有 些 情况 也 可 以 直接 使 用 有 地 址 的 数 
组 、 二 又 树 ， 或 者 其 他 结构 。 


许多 程序 设计 语言 内 置 基 本 的 数据 类 型 ， 提 供 对 关联 数组 的 支持 。 而 
Content-addressable memory 则 是 硬件 层面 上 实现 对 关联 数组 的 支持 。 


2. 散 列表 


散 列 表 (Hash table， 也 叫 哈 和 希 表 ) ， 有 是 根据 关键 字 (Key value) 而 直 
接 访 问 在 内 存 存储 位 置 的 数据 结构 。 即 把 键 值 通过 一 个 函数 的 计算 ， 


映射 到 表 中 一 个 位 置 来 访问 记录 ， 加 快 了 查找 速度 。 这 个 映射 函数 称 
作 散 列 函 数 ， 存 放 记 录 的 数组 称 作 散 列 表 。 


1.10.6 字典 的 辆 数 


跟前 面 所 讲述 的 其 他 对 象 类 似 ， 字 典 也 有 一 些 函 数 。 通 过 这 些 函 数 ， 
能 够 实现 对 字典 的 操作 。 


1.copy 和 deepcopy 
搁 贝 是 copy 的 音译 ， 标 准 的 汉语 翻译 是 “复制 ”。 


在 一 般 的 理解 中 ，copy 束 是 将 原来 的 东西 再 做 一 份 。 但 是 ， 在 Python 
里 面 (乃至 于 很 多 编程 语言 中 ) ，copy 可 不 是 那么 简单 的 。 


> 三 和 


>>> b = a 


SR 本 


5 


这 样 做 是 不 是 就 得 到 了 两 个 5 了 呢 ? 表面 上 看 似乎 是 ， 但 是 ， 不 要 忘记 
在 前 面 反 复 提 到 的 : 对 象 有 类 型 ， 变 量 无 类 型 ， 正 古 因 为 这 句 话 ， 变 
量 其 实 是 一 个 标签 。 不 妨 请 出 法 宝 : id0， 专 门 查 看 内 存 中 的 对 象 编 


[es 


过 


>>> id(a) 
139774080 
>>> id(b) 


139774080 


果然 ， 并 没有 两 个 5， 就 一 个 ， 只 不 过 是 贴 了 两 张 标 签 而 已 。 这 种 现象 
0 °。 其 他 的 就 不 演示 了， 就 仅 看 看 
dict 类 型 。 


>>> ad = {"name":"qiwsir", "lang":"python"} 
>>> bd = ad 

>>> bd 

{'lang': 'python', 'name': 'qiwsir 了 

>>> id(ad) 

3072239652L 

>>> id(bd) 


3072239652L 


又 是 一 个 对 象 贴 了 两 个 标签 ， 这 是 用 赋值 的 方式 实现 的 所 谓 “ 假 装 找 
贝 ”。 那 么 如 果 用 copy 的 方法 呢 ? 


>>> cd = ad.copy() 

> C0 

{'lang': 'python', 'name': 'giwsir'} 
>>> id(cd) 


3072239788L 


这 次 得 到 的 cd 跟 原 来 的 ad 是 不 同 的 ， 它 在 内 存 中 另 尽 了 一 个 空间 。 如 
果 我 尝试 修改 cd， 应 该 对 原来 的 ad 不 会 造成 任何 影响 。 


>>> cd["name"] = "itdiffer.com" 

>>> cd 

{'lang': 'python', 'name': 'itdiffer.com'} 
>>> ad 


{'lang': 'python', 'name': 'giwsir'} 


真 的 跟 推 理 一 模 一 样 。 所 以 ， 只 要 理解 了 “变量 是 对 象 的 标签 ， 对 象 
有 类 型 而 变量 无 类 型 ， 丈 能 正确 推断 出 Python 能 够 提供 的 结果 。 刚 才 
已 经 看 到 了 ，bd 和 ad 引用 了 同一 个 内 存 对 象 。 


> bd 
{'lang': 'pyth qiw. } 
>>> bd["name"] = "laoqgi" 
>>> ad 


{'lang': 'python', 'name': 'laoqi'} 
>>> bd 


{'lang': 'python', 'name': "1aoqi' 


修改 了 bd 所 对 应 的 “对 象 ?，ad 的 “对 象 ”也 变 了 。 
然而 ， 事 情 并 没有 那么 简单 ， 下 面 看 仔细 一 点 ， 否 则 束 迷 范 了 。 


> x = {"name":"qiwsir", "lang":["python", "java", "c"]} 
>>> y = x.copy() 
>>> y 
{'lang': ['python', 'java', 'c'], 'name': 'giwsir'} 
>>> id(x) 
3072241012L 
>>> id(y) 


3072241284L 


y 是 从 x 拷贝 过 来 的 ， 两 个 在 内 存 中 是 不 同 的 对 象 。 


>>> y["lang"].remove("c") 


在 y 所 对 应 的 字典 对 象 中 ， 键 "lang" 的 值 是 一 个 列表 ， 为 
['python'，'java'"，'c']， 这 里 用 remove() 删 除 其 中 的 一 个 元 素 "c"。 删 除 
之 后 ， 这 个 列表 变 为 : ['python'，'java'] 。 


{'lang': ['python', 'java'], 'name': 'qiwsir'} 


那么 ，x 所 对 应 的 字典 中 ， 这 个 列表 变化 了 吗 ? 应 该 没有 变化 ， 因 为 按 
照 前 面 所 讲 的 ， 它 是 男 外 一 个 对 象 ， 两 个 互 不 干扰 。 


{'lang': ['python', 'java'], 'name': 'qiwsir'} 


仔细 观察 ， 是 不 是 有 点 出 平 意料 呢 ? 我 没有 作 浆 哦 。 如 果 不 信 ， 就 按 
照 操作 自己 在 交互 模式 中 试 试 ， 是 不 是 也 能 够 得 到 这 个 结果 呢 ? 这 是 
为 什么 ? 

但 是 ， 如 果 要 操作 另外 一 个 链 值 对 


>>> y 
{'lang': ['python', 'java'], 'name': 'laoqi'} 


前 面 所 说 的 原理 是 有 效 的 ， 为 什么 当 值 是 列表 的 时 候 就 不 奏效 了 呢 ? 
要 破解 这 个 迷 局 还 得 用 id(): 


>>> id(x) 


3072241012L 
>>> id(y) 


3072241284L 


x 和 y 对 应 着 两 个 不 同 的 对 象 ， 的 确 如 此 。 但 这 个 对 象 (字典 ) 是 由 两 
个 键 值 对 组 成 的 ， 其 中 一 个 键 的 值 是 列表 。 


>>> id(x["lang"]) 
3072243276L 
>>> id(y["lang"]) 


3072243276L 


发 现 了 这 样 一 个 事实 : 列表 是 同一 个 对 象 。 
但 是 ， 作 为 字符 串 为 值 的 那个 刍 值 对 分 属 不 同 的 对 象 。 


>>> id(x["name"]) 
3072245184L 
>>> id(y["name"]) 


3072245408L 


这 个 事实 不 说 明了 为 什么 修改 一 个 列表 ， 男 外 一 个 也 跟着 修改 ， 而 修 
改 一 个 字符 串 ， 男 外 一 个 不 跟随 的 原因 了 。 


但 是 ， 似 乎 还 没有 解 开 深层 的 原因 。 深 层 的 原因 与 Python 存储 的 对 和 象 
类 型 〈 在 不 少 地 方 也 用 “数据 类 型 "的 说 法 ， 其 实 两 者 是 一 样 的 , “对 
象 "? 和 “数据 ”在 Python 中 等 同 ， 不 用 区 分 ) 特点 有 关 ，Python 只 存储 基 
本 类 型 的 数据 ， 比 如 int、str， 对 于 不 是 基础 类 型 的 ， 比 如 字典 的 值 是 
列表 ，Python 不 会 在 被 复制 的 那个 对 象 中 重新 存储 ， 而 是 用 引用 的 方 
式 ， 指 向 原来 的 值 。 通 俗 地 说 ，Python 在 所 执行 的 复制 动作 中 ， 如 果 
征 基 本 类 型 的 数据 ， 束 在 内 存 中 重 狐 建 个 页 ， 如 果 不 是 基本 类 型 的 ， 
束 不 新 建筑 了 ， 而 是 用 标签 引用 原来 的 宽 。 即 如 果 比 较 催 单 ， 随 便 建 
立新 依 即 可 ; 但 是 ， 如 有 宁 对 象 太 复 杀 了 ， 融 别 费 劲 了 ， 还 是 引用 一 下 
原来 的 省 事 。 


所 以 ， 把 用 copy0 实 现 的 拷贝 称 之 为 “ 浅 揪 贝 ”( 不 仅 Python， 很 多 语言 
都 有 " 浅 拷 贝 ”。 顾 名 思 义 ， 没 有 解决 深层 次 问题 。 言 外 之 意 ， 还 有 能 
够 解决 深层 次 问题 的 方法 ) 。 

与 “ 浅 拷贝 "对 应 ， 在 Python 中 ， 还 有 一 个 “ 深 堵 贝 ”(deep copy) 。 不 
a 要 用 import 导 入 一 个 模块 9 


>>> import copy 


>>> Z = copy.deepcopy(x) 


{'lang': ['python', 'java'], 'name': 'qiwsir'} 


用 copy.deepcopy0) 深 拷贝 了 一 个 新 的 副本 ， 用 id0 来 勘察 一 番 : 


>>> id(x["lang"]) 
3072243276L 
>>> id(z["lang"]) 


3072245068L 


采 然 是 另外 一 个 “ 视 ”， 不 是 引用 了 “。 如 采 按 照 这 个 结 有 未 ， 修 改 其 中 一 
个 列表 中 的 元 素 ， 应 该 驶 不 影响 另外 一 个 了 。 


>>> x 


{'lang': ['python', 'java'], 'name': 'qiwsir'} 
>>> x["lang"].remove("java") 

we 基 

{'lang': ['python'], 'name': 'qiwsir'} 

>>> ZzZ 


{'lang': ['python', 'java'], 'name': 'qiwsir'} 


果然 如 此 ， 再 试 试 才 过 交 呀 。 
>>> x["lang"].append("c++") 


a 


{'lang': ['python', 'c++'], 'name': 'qiwsir'} 
这 束 是 所 请 的 浅 找 贝 和 深 堵 贝 。 
2.clear 


在 交互 模式 中 ， 用 help 是 一 个 很 好 的 习惯 。 


>>> help(dict.clear) 
clear(...) 


D.clear() -> None. Remove all items from D. 


这 是 一 个 清空 字典 中 所 有 元 素 的 操作 。 


>>> a = {"name":"qiwsir"} 
>>> a.clear() 
>>> a 


{ 


clear 的 含义 是 将 字典 清空 ， 得 到 的 是 " 空 "字典 。 它 和 del 有 着 很 大 的 区 
别 ，del 是 将 字典 删 除 ， 内 存 中 就 没有 它 了 ， 并 不 是 为 " 空 ”(“ 空 和 无 
是 有 区 别 的 ， 至 少 在 编程 语言 中 有 区 别 。 在 其 他 方面 也 有 区 别 ， 比 
如 “色即是空 ， 不 能 是 无" 吧 ) 。 


>>> del a 


2 a 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


NameError: name 'a' is not defined 


果然 删除 了 。 


男 外 ， 如 采 要 清空 一 个 字典 ， 还 能 够 使 用 a={} 这 种 方法 ， 但 这 种 方法 
的 本 质 十 将 变量 a 转向 了 {} 这 个 对 象 ， 那 么 原来 的 呢 ? 原来 的 成 为 了 断 
线 的 风筝 。 这 样 的 东西 在 Python 中 称 之 为 垃圾 ， 而 且 Python 能 够 目 动 

将 这 样 的 垃圾 回收 。 读 者 束 不 用 关心 它 了 ， 反 正 Python 会 处 理 的 。 


3.get 和 和 setdefault 


get 的 含义 是 : 


get(...) 


D.get(k[,d]) -> D[k] if k in D, else d. d defaults to None. 


注意 ， 在 这 个 说 明 中 ,“ifkin D? 吏 返回 其 值 。 


>>> d 
{'lang': 'python'} 
>>> d.get("lang") 


"python' 


dict.get() 就 是 要 得 到 字典 中 某 个 键 的 值 ， 只 是 它 没 有 那么 “严厉 * 妥 了 。 
因为 类 似 获 得 字典 中 键 值 的 方法 ， 如 d[lang] 就 能 得 到 对 应 的 
值 "python"， 可 是 ， 如 果 要 获取 的 键 不 存在 : 


>>> print d.get("name") 


None 
>>> d["name"] 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


KeyError: "name' 


这 束 是 dict.get() 和 dict['key"] 的 区 别 。 
如 采 键 不 在 字典 中 ， 会 返回 None， 这 是 一 种 情况 ， 另 外 还 可 以 这 样 : 


>>> d = {"lang":"python"} 


> newd = d.get("name", 'qiwsir') 


以 d.get (name"，'qiwsir) 的 方式 ， 如 果 不 能 得 到 键 "name" 的 值 ， 就 
返回 后 面 指定 的 值 "qiwsir"。 这 了 束 是 文档 中 D[kifk in D，else d. 的 含 
义 ， 这 样 做 并 没有 影响 原来 的 字典 。 


妨 外 一 个 跟 get 在 功能 上 有 相似 地 方刚 十 D.setdefault Wi -其 售 义 
AXE: 


setdefault(...) 


D.setdefault(k[,d]) -> D.get(k,d), also set D[k]=d if k not in D 


首先 ， 它 要 执行 D.get (k，d) 就 跟前 面 一 样 了 ， 然 后 ， 进 一 步 执行 另 
dl 如 有 果 键 k 不 在 字典 中 ， 残 在 字典 中 增加 这 个 键 值 对 。 当 
内， 如 果 有 就 没有 必要 执行 这 一 步 了 。 


>>> d 
{'lang': 'python'} 
>>> d.setdefault("lang") 


"python' 


在 字典 中 ， 有 "lang" 这 个 键 ， 就 返回 它 的 值 。 


>>> d.setdefault("name"，"qiwsir") 


"qiwsir 


{'lang': 'python', "name': 'giwsir'} 


在 字典 中 没有 "name" 这 个 键 ， 于 是 返 Hld. setdefault 
("name"，"giwsir") 指定 的 值 "qiwsir"， 并 且 将 键 值 
对 mame':"qiwsir" 添 加 到 原来 的 字典 中 。 


如 采 这 样 操作 : 


>>> d.setdefault("web") 


什么 也 没有 返回 吗 ? 不 是 ， 返 回 了 ， 只 不 过 没有 显示 出 来 ， 如 有 果 你 用 
print 束 能 看 到 了 。 因 为 这 里 返回 的 是 一 个 None， 不 妨 查 看 一 下 那个 字 


一 


{'lang': 'python', 'web': None, 'name': 'qiwsir'} 


键 "web" 的 值 成 为 了 None 。 
4.items/iteritems, keys/iterkeys, values/itervalues 


这 个 标题 中 列 出 的 是 三 组 函数 ， 并 且 这 三 组 有 相似 的 地 方 。 在 这 里 详 
细 讲 述 一 下 第 一 组 ， 其 余 两 组 ， 我 想 皂 借读 者 的 聪明 智慧 是 不 在 话 下 
的 。 


>>> help(dict.items) 
items(...) 


D.items() -> list of D's (key, value) pairs, as 2-tuples 


这 种 获取 帮助 信息 的 方法 是 惯用 的 仪 俩 了， 项 望 读者 能 熟悉 ， 并 在 目 
己 的 代码 生涯 中 常用 。D.items() 能 够 得 到 一 个 天 于 字典 的 列表 ， 列 表 
中 的 元 素 征 由 字典 中 的 键 和 值 组 成 的 元 组 。 例 如 : 


>>> dd = {"name":"qiwsir", "lang":"python", "web":"www.itdiffer.com"} 
>>> dd_kv = dd.items() 
>>> dd_kv 


[('lang', 'python'), ('web', 'www.itdiffer.com'), ('name', 'qiwsir')] 


2 年 有 返回 值 的 。 这 个 操作 在 后 面 要 讲 到 的 循环 中 将 有 很 大 的 作 


跟 items 类 似 的 是 iteritems， 这 个 词 的 特点 是 由 iter 和 items 拼 接 而 成 的 ， 
部 分 items 就 不 用 说 了 ， 肯 定 是 在 告诉 我 们 ， 得 到 的 结果 跟 D items0 
的 结果 类 似 。 还 有 一 个 iter 是 什么 意思 ? 前 面 我 提 到 了 一 个 

词 viterable"， 它 的 含义 是 “可 迭代 的 >， 这 里 的 iter 是 指名 词 iterator 的 前 
部 分 ， 意 思 是 “迭代 器 >。 合 起来 ，"iteritems" 的 含义 就 是 : 


iteritems(...) 


D.iteritems() -> an iterator over the (key, value) items of D 


你 看 ， 学 习 Python 不 是 什么 难事 ， 只 要 充分 使 用 帮助 文档 束 好 了 “。 这 

告诉 我 们 ， 得 到 的 是 一 个 “和 欠 代 器 ”( 关 于 什么 是 欠 代 器 ， 以 及 相关 
的 内 容 ， 后 续 会 详细 讲述 ) ， 这 个 和 欠 代 大 是 天 于 “Ditems0” 的 。 看 个 
例子 殴 明 白 了 。 


>>> dd 


{'lang': 'python', 'web': 'www.itdiffer.com', 'name': 'giwsir'} 


>>> dd_iter = dd.iteritems() 

>>> type(dd_iter) 

<type 'dictionary-itemiterator'> 

>>> dd_iter 

<dictionary-itemiterator object at QOxb72b9a2c> 
>>> list(dd_iter) 


[('lang', 'python'), ('web', 'www.itdiffer.com'), ('name', 'qiwsir')] 


得 到 的 dd_iter 是 一 个 'dictionary-itemiterator 类 型 ， 不 过 这 种 迭代 器 类 型 
的 数据 不 能 直接 输出 ， 必 须 用 list(0) 转 换 一 下 ， 才 能 看 到 里 面 的 真 面 
目 。 


另外 两 组 含义 跟 这 个 相似 ， 只 不 过 是 得 到 key 或 者 value 。 下 面 仅 列举 
一 下 例子 ， 具 体内 容 ， 读 者 可 以 自行 在 交互 模式 中 看 文档 。 


>>> dd 


{'lang': 'python', 'web': 'www.itdiffer.com', 'name': 'qiwsir' 
>>> dd.keys() 

['lang', 'web', 'name'] 

>>> dd.values() 


['python', 'www.itdiffer.com', "qiwsir '] 


这 里 先 区 代 一 句 ， 如 果 要 实现 对 “ 键 值 " 对 或 者 “ 键 ? 或 者 “ 值 ?的 循环 ， 
人 。 对 这 句 话 的 理解 ， 继 续 阅 读本 书 惑 能 找到 
年 符 。 


5.pop 和 popitem 

还 记得 删除 列表 中 元 素 的 函数 是 哪个 吗 ? pop 和 remove， 这 两 个 的 区 别 
在 于 : list.remove (x) 用 来 删除 指定 的 元 素 ， 而 listpop 《〈[) 用 于 删 
除 指定 索引 的 元 素 ， 如 果 不 提供 索引 值 ， 束 默认 删除 最 后 一 个 。 


在 字典 中 ， 也 有 删除 键 值 对 的 函数 。 


pop(...) 


D.pop(k[,d]) -> v, remove specified key and return the corresponding value. 


If key is not found, d is returned if given, otherwise KeyError is raised 


D.pop (k[，d]) 是 以 字典 的 键 为 参数 ， 删 除 指定 键 的 键 值 对 ， 当 然 ， 
如 条 输入 对 应 的 值 也 可 以 ， 那 个 是 可 选 的 。 


>>> dd 


{'lang': 'python', 'web': 'www.itdiffer.com', 'name': 'giwsir'} 
>>> dd.pop("name") 


删除 指定 键 "name"， 返 回 了 其 值 "qiwsir"。 这 样 ， 在 原 字 典 
中 ,“mname':qiwsir” 这 个 键 值 对 束 被 删除 了 。 


>>> dd 


{'lang': 'python', 'web': 'www.itdiffer.com'} 


0 是 ，pop 函 数 中 的 参数 是 不 能 省 略 的 ， 这 跟 列 表 中 的 pop 有 


>>> dd.pop() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: pop expected at least 1 arguments, got 0 


如 有 果 要 删除 字典 中 没有 的 键 值 对 ， 也 会 报错 。 


>>> dd.pop("name") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


KeyError: "name' 


有 意思 的 是 D.popitem0) 跟 listpopO0 有 相似 之 处 ， 不 用 写 参数 (list.pop0 
可 以 不 写 参 数 ) ， 但 是 ，D.popitem0O 不 是 删除 最 后 一 个 ，dict 没 有 顺 
也 就 没有 最 后 和 最 和 完了 ， 它 是 随机 删除 一 个 ， 并 将 所 删除 的 返 


popitem(...) 


D.popitem() -> (k, v), remove and return some (key, value) pair as a 


2-tuple; but raise KeyError if D is empty. 


如 有 果 字 典 是 空 的 ， 就 要 报错 了 


>>> dd 

{'lang': 'python', 'web': 'www.itdiffer.com'} 
>>> dd.popitem() 

('lang', 'python') 

>>> dd 


{'web': 'www.itdiffer.com'} 


成 功 地 删除 了 一 对 ， 注 意 是 随机 的 ， 不 是 删除 前 面 显示 的 最 后 一 个 ， 
你 做 同样 的 操作 ， 或 许 删除 的 对 象 跟 我 删除 的 不 一 样 。 并 且 返 回 了 删 
除 的 内 容 ， 返 回 值 是 元 组 类 型 ， 且 其 元 素 为 所 删除 的 键 和 值 。 


>>> dd.popitems() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


AttributeError: 'dict' object has no attribute 'popitems' 


背 了 ? 注意 看 提示 信息 ， 果 然 错 了 。 注 意 是 popitem， 不 要 多 了 s， 前 
面 的 D.itemsO 中 包含 5， 是 复数 形式 ， 说 明 它 能 够 返回 多 个 结果 (多 个 
元 组 组 成 的 列表 ) ， 而 在 D.popitem() 中 ， 一 次 只 能 随机 删除 一 对 键 值 
0 
昭光 


>>> dd.popitem() 


('web', 'www.itdiffer.com') 
>>> dd 


0 


都 删 了 ， 字 典 成 空 的 了 。 如 果 再 删 ， 会 怎么 样 ? 
>>> dd.popitem() 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


KeyError: 'popitem(): dictionary is empty' 


报错 信息 中 明确 告知 ， 字 典 已 经 是 至 的 了 ， 没 有 能 删 的 东西 了 。 
6.update 
update()， 看 名 字 环 猜测 到 一 二 了 ， 是 不 是 更 新 字典 内 容 呢 ? 的 确 是 。 


update(...) 


D.update([E, ]**F) -> None. Update D from dict/iterable E and F. 
If E present and has a .keys() method, does: for k in E: D[k] = E[k] 
If E present and lacks .keys() method, does: for (Kk, V in E: DIK] = V 


In either case, this is followed by: for k in F: D[k] = F[k] 


看 样子 这 个 函数 有 点 复杂 ， 不 要 着 急 ， 通 过 实验 可 以 一 点 一 点 鼓 揭 明 


， 这 个 函数 返回 值 是 None， 它 的 作用 束 是 更 新 字典 。 其 参数 可 以 
典 或 者 某 种 可 迭代 的 对 象 。 


>>> d1 = {"lang":"python"} 


>> d2 = {"song":"I dreamed a dream"} 
>>> d1.update(d2) 

>>> di 

{'lang': 'python', 'song': 'I dreamed a dream'} 


>>> d2 


{'song': 'I dreamed a dream'} 


这 样 束 把 字典 d2 更 新 纳入 了 d1 那 个 字典 ， 于 是 dl 中 就 多 了 一 些 内 容 ， 
因为 把 d2 的 内 容 包 含 进来 了 。 当 然 d2 还 存在 ， 并 没有 受到 影响 。 
还 可 以 用 下 面 的 方法 更 新 : 


>>> d2 
{'song': 'I dreamed a dream'} 


>>> d2.update([("name", "qiwsir"), ("web","itdiffer.com")]) 
>>> d2 


{'web': 'itdiffer.com', 'name': 'qiwsir', 'song': 'I dreamed a dream'} 


列表 内 的 元 组 是 键 值 对 。 


7.has_key 


这 个 函数 的 功能 是 判断 字典 中 是 否 存 在 某 个 键 。 
has_key(...) 


D.has_key(k) -> True if D has a key k, else False 


跟前 一 节 中 过 到 的 k in DD 类 似 。 


>>> d2 


{'web': 'itdiffer.com', 'name': 'qiwsir', 'song': 'I dreamed a dream'} 
>>> d2.has_key("web") 


True 


RS web" in d2 


天 于 dict 的 函数 似乎 不 少 。 不 用 看 急 ， 也 不 用 担心 记 不 住 ， 因 为 根本 不 
需要 记忆 ， 只 要 会 用 搜索 即 可 。 


1.11 集合 


python 是 一 个 发 展 的 语言 ， 尽 管 前 面 已 经 有 好 几 种 对 象 类 型 了 ， 但 
古 ， 从 实践 的 角度 看 还 不 够 所以， 又 有 了 名 日 “集合 ”的 这 种 类 型 。 
当然 ， 对 和 象 类 型 本 质 上 是 上 自己 可 以 定义 的 ， 要 想 学 会 目 己 定义 ， 请 继 
续 阅 读本 书 ， 不 要 半途 而 废 ,“ 而 世 之 奇 伟 、 现 怪 ， 非 常 之 观 ， 常 在 于 
而 人 之 所 罕 至 大 ， 故 非 有 志 者 不 能 至 也 。” 《王安石 《 游 春 禅 山 
i g 


男 外 ， 也 不 要 担心 记 不 住 ， 你 只 要 记 住 爱 因 斯 坦 说 的 束 好 了 : 


爱 因 斯 坦 在 美国 演讲 ， 有 人 间 :“ 你 可 记得 声音 的 速度 是 多 少 ? 你 如 何 
记 下 许多 东西 ?” 


爱 因 斯 坦 轻 松 答 道 : “声音 的 速度 是 多 少 ， 我 必须 得 酬 典 才能 回答 。 
为 我 从 来 不 记 在 辞典 上 已 经 印 着 的 东西 ， 我 的 记忆 力 是 用 来 记忆 书本 
上 没有 的 东西 。” 


多 么 霸气 的 回答 ， 这 回答 不 仅 霸 气 ， 还 告诉 我 们 一 种 方法 : 只 要 走 能 
够 通过 某 种 方法 查找 到 的 ， 就 不 需要 记忆 。 


各 种 对 和 象 类 型 都 可 以 通过 下 述 方法 但 不 限于 这 些 方法 查 到 |: 


。 交互 模式 下 用 dir0 或 者 heljpO 。 
。 使 用 Google。 
上 述 方 法 从 本 书 开始 丈 不 断 强 调和 示范 ， 目 的 瓯 在 于 提示 读者 要 掌握 
pa 0 1 i 
对 学 过 的 对 象 类 型 做 个 归纳 整理 : 
能 够 索引 的 ， 如 list/str， 其 中 的 元 素 可 以 重复 。 
可 变 的 ， 如 lisvdict， 即 其 中 的 元 素 / 刍 值 对 可 以 原 地 修改 。 


。 不 可 变 的 ， 如 str/int， 即 不 能 进行 原 地 修改 。 
。 无 索引 序列 的 ， 如 dict， 即 其 中 的 元 素 ( 键 值 对 ) 没有 排列 顺序 。 


1.11.1 创建 集合 


集合 的 英文 是 set， 翻 译 过 来 叫 作 “集合 ”。 它 的 特点 是 : 有 的 可 变 ， 有 
的 不 可 变 ; 元 素 无 次 序 ， 不 可 重复 。 


如 果 说 元 组 (tuple) 算是 列表 (list) 和 字符 串 (str) 的 杂 合 ， 那 么 集 
合 (set) 则 可 以 堪 称 是 list 和 dict 的 杂 合 。 


集合 拥有 类 似 字 典 的 特点 : 可 以 用 {} 花 括号 来 定义 ， 其 中 的 元 素 没 有 
序列 ， 也 残 是 非 序列 类 型 的 数据 ; 而且 集合 中 的 元 素 不 可 重复 ， 这 就 
类 似 于 dict 键 。 

集合 也 有 一 点 列表 的 特点 : 有 一 种 集合 可 以 在 原 处 修改 。 


通过 实验 ， 了 巡 步 理解 创建 set 的 方法 : 


>> S1 = set("qiwsir") 


>> s1 


set(['q', 'i', 's', 'r', 'w']) 


把 字符 串 中 的 字符 拆 解 开 形成 了 集合 。 特 别 注意 观察 : qiwsir 中 有 两 个 
i， 但 是 在 sl 中 只 有 一 个 :1， 也 就是 集合 中 元 到 不 能 重复 。 


>>> S2 = set([123, "google", "face", "book", "facebook", "book"]) 


入 六 


set(['facebook', 123, 'google', 'book', 'face']) 


在 创建 集合 的 时 候 ， 如 果 发 现 了 重复 的 元 素 ， 吏 会 过 滤 一 下 ， 剩 下 不 
重复 的 。 而 且 ， 从 s2 的 创建 可 以 看 出 ， 查 看 结果 时 显示 的 元 素 排 列 顺 
序 与 开始 建立 时 不 同 ， 完 全 是 随意 显示 的 〈 怎 么 能 说 明 是 随机 的 呢 ? 
读者 有 没有 办 法 ? ) ， 这 说 明 集 合 中 的 元 素 没有 序列 。 


>>> s3 = {"facebook", 123} # 通 过 {} 直 接 创 建 


>> S3 


set([123, 'facebook ']) 


除了 用 set0 来 创建 集合 ， 还 可 以 使 用 旭 的 方式 ， 但 是 这 种 方式 不 提倡 
使 用 ， 因 为 在 某 些 情况 下 ，Python 桶 不 请 翁 旦 字典 还 是 集合 。 看 看 下 
面 的 探讨 就 发 现 问 题 了 。 


>>> s3 = {"facebook", [1,2,'a'], {"name":"python", "lang":"english"}, 123} 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: unhashable type: 'dict' 


>>> S3 = {"facebook", [1,2], 123} 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: unhashable type: 'list' 


0 通过 {} 无 法 创建 公有 列表 或 者 字典 类 型 对 和 象 元 


认真 阅读 报错 信息 ， 有 这 样 的 词汇 : “unhashable”， 在 理解 这 个 词 之 
前 ， 先 看 它 的 反义词 “hashable”， 很 多 时 候 翻 译 为 “可 哈 希 *， 其 实 它 有 
一 个 不 是 音译 的 名 词 “ 散 列 ”。 如 果 我 们 简单 点 理解 ， 某 数据 “不 可 哈 
希 ” (unhashable) 就 是 其 可 变 ， 如 列表 和 字典 都 能 原 地 修改 ， 就 是 
unhashable。 否 则 ， 不 可 变 的 ， 类 似 字符 串 那 样 不 能 原 地 修改 的 就 是 
hashable (可 哈 希 ) 。 


对 于 字典 类 型 的 对 象 ， 其 “ 键 ” 必 须 是 hashable， 即 不 可 变 。 
现在 过 到 的 集合 ， 其 元 素 也 是 “可 哈 硕 ”的 。 上面 的 例子 ， 试 图 将 字 
典 、 列 表 作 为 元 素 的 元 素 ， 束 报错 了。 而 且 报错 信息 中 明确 告知 列表 
和 字典 是 不 可 哈 希 类 型 ， 言 外 之 意 ， 里 面 的 元 素 都 应 该 是 可 哈 希 类 


型 。 


继续 探索 另外 一 种 情况 : 


>> S1 


i) 

>>> S1[1] = "I" 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: 'set' object does not support item assignment 


0 进一步 说 明 集 合 不 是 序列 类 型 ， 不 能 用 索引 方式 对 其 进行 
牙 改 。 


根据 前 面 的 经 验 ， 类 型 名 称 函 数 能 够 实现 类 型 转换 ， 比 如 str0 就 是 将 
对 象 转化 为 字符 串 ， 同 理 ， 分 别 用 listQ) 和 setO) 能 够 实现 集合 和 列表 两 
种 对 象 之 间 的 转化 。 


>>> lst = list(s1) 


>>> lst 


ww SET se "LY" 


>>> lst 


特别 说 明 ， 利 用 set0 建 立 起 来 的 集合 是 可 变 集 合 ， 可 变 集合 都 是 
unhashable 类 型 的 。 


1.11.2 ”集合 的 函数 


把 与 集合 有 关 的 函数 找 出 来 。 


>>> dir(set) 


【人 
1 
Ve oN he No 0 nd dO, "Ton. BM Ty ep ys =or 
eub _rxor. 本 Setattr ', "Sizeof ' str_ Sau Sub 本 ， Subclasshook_ 一 xor ， 'add', 'c 
lear', 'copy', 'difference', 'difference update', 'discard', 'intersection', 'intersection update', 'isdisjoint', 'iss 
ubset', 'issuperset', 'pop', 'remove', 'symmetric difference', 'symmetric_difference update', 'union', 'update'] 


为 了 看 清楚 ， 我 把 双 画 线 “_” 先 删除 掉 : 


'add', 'clear', 'copy', 'difference', 'difference update', 'discard', "intersection'， 'intersection update', 'isdisjoi 
nt', "'issubset', 'issuperset', 'pop', 'remove', 'symmetric_difference', 'symmetric_difference update', 'union'， 'updat 
el 


然后 用 heljpO 可 以 找到 每 个 画 数 的 具体 使 用 方法 。 


1.add 和 update 


>>> help(set.add) 
Help on method_descriptor: 


add(...) 
Add an element to a set. 


This has no effect if the element is already present. 


在 交互 模式 中 ， 可 以 看 到 |: 


>>> a_set = {} # 我 想当然 地 认为 这 样 也 可 以 建立 一 个 set 
>>> a_set.add("qiwsir") # 报 错 ! 看 错误 信息 。 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: 'dict' object has no attribute 'add' 


>>> type(a_set) #Python 认 为 我 建立 的 是 一 个 dict 


<type 'dict'> 


{} 这 个 东西 在 dict 和 set 中 都 有 用 ， 但 是 ， 若 按照 上 面 的 方法 则 建立 的 
是 dict， 而 不 是 set。 这 是 Python 规定 的 ， 要 建立 set， 只 能 用 前 面 已 经 
看 到 的 创建 方法 了 。 


> A Set = {a 
>>> type(a_set) 


<type 'set'> 


>>> a_set.add("qiwsir") # 增 加 一 个 元 素 
>>> a_set # 原 地 修改 
set(['i', 'a', 'qiwsir']) 


>>> b_set = set("python") 

>>> type(b_set) 

<type 'set'> 

>>> b_set 

Sett lt "op ME 
>>> b_set.add("qiwsir") 

>>> b_set 


set(['h', 'o', in', 'p', 't', 'qiwsir', 'y']) 


>>> b_set.add([1,2,3]) # 列 表 是 不 可 哈 希 的 ， 集 合 中 的 元 素 应 该 是 nashable 类 型 。 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: unhashable type: 'list' 


>>> b_set.add('[1,2,3]') # 可 以 这 样 ! 
> Det 


set(['[1,2,3]', 'h', 'o', Nn', 'p', 't', ‘qiwsir', 'y']) 


除了 add0 之 外 ， 还 能 够 从 男 外 一 个 集合 中 合并 过 来 元 素 ， 方 法 是 


set.update (s2) 。 


>>> help(set.update) 
update(...) 


Update a set with the union of itself and others. 


>%> 91 

人 下 二 全 

>>> S2 

set(['github', 'qiwsir']) 
>>> si1.update(s2) 

>>> sl1 


set(['a', 'qiwsir', 'b', 'github']) 


>>> S2 


set(['github'，'qiwsir']) 


2. pop, remove, discard, clear 


>>> help(set .pop) 
pop(...) 
Remove and return an arbitrary set element. 


Raises KeyError if the set is empty. 


>>> b_set 
set(['[1,2,3]', 'h', 'o', 'n', 'p', 't', 'qiwsir', 'y']) 
>>> b_set.pop() # 从 set 中 任意 选 一 个 删除 ， 并 返回 该 值 


i 

>>> b_set .pop() 
ih' 

>>> b_set .pop() 
‘0! 

>>> b_set 


set(['n', 'p', 't', 'qiwsir', 'y']) 


>>> b_set.pop("n") # 如 果 要 指定 删除 某 个 元 素 就 报错 了 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: pop() takes no arguments (1 given) 


set.popO 是 从 集合 中 随机 选 一 个 元 素 删除 并 将 这 个 值 返 回 ， 但 是 不 能 指 
数 。 此 外 ， 如 果 


定员 除 某 个 元 素 报错 信息 告诉 我 们 ，pop0O 不 能 有 参 


集合 是 空 的 了 ， 再 做 pop0 操 作 也 报错 。 
但 是 否 可 以 删除 指定 元 素 ? 如 果 可 以 ， 怎 么 办 ? 


>>> help(set.remove) 
remove(...) 


Remove an element from a set; it must be a member. 


If the element is not a member, raise a KeyError. 


会 有 办 法 的 ， 那 么 多 了 胶 明 人 早 号 为 读者 想 好 了 一 个 男 


一 一 setremove (obj) 中 的 obj， 必 须 是 set 中 的 元 素 ， 


>>> a_set 
SBt{([' i", Tat; diwesir’']y 
>>> a_set.remove("i") 


>>> a_set 


数 


removel() 


否则 惑 报错 。 


set(['a', 'qiwsir']) 

>>> a_set.remove("w") 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


KeyError: 'w' 


跟 remove (obj) 类 似 的 还 有 discard (obj) 


>>> help(set.discard) 


discard(...) 
Remove an element from a set if it is a member. 


If the element is not a member, do nothing. 


与 help (set.remove) 进行 信息 对 比 ， 看 看 有 什么 不 同 。 关 键 在 于 如 果 
discard (obj) 中 的 obj 是 set 中 的 元 素 就 删除 ， 如 有 果 不 是 ， 就 什么 也 不 
做 。 狐 闻 束 要 对 比 着 看 才 有 意思 ， 这 里 也 一 样 。 


>>> a_set.discard('a') 
>>> a_set 
set(['qiwsir']) 

>>> a_set.discard('b') 


>>> 


在 删除 上 还 有 一 个 绝 杀 ， 就 是 set.clear()， 它 的 功能 是 : Remove all 
elements from this set，( 自 己 在 交互 模式 下 help (set.clear) ) 。 


>>> a_set 
set(['qiwsir']) 
>>> a_set.clear() 
>>> a_set 

set([]) 


>>> bool(a_set) # 空 了 , boo1 一 下 返回 False , 


False 


1.11.3” 六 充 知 识 
集合 也 是 一 个 数学 概念 (以 下 定义 来 自 维基 百科 ) : 
最 简单 的 说 法 是 最 原始 的 集合 论 一 一 朴素 集合 论 中 的 定义 ， 集 合 束 


是 “一 堆 东 西 ?。 集 合 里 的 “东西 ? 叫 作 元 素 。 若 然 x 是 集合 A 的 元 素 ， 记 
作 xEA 。 


集合 是 现代 数学 中 一 个 重要 的 基本 概念 。 集 合 论 的 基本 理论 直到 19 世 
纪 末 才 被 创立 ， 现 在 已 经 是 数学 教育 中 一 个 普 壳 存在 的 部 分 ， 在 小 学 
时 束 开 始 学 习 了 。 这 里 对 被 数学 家 们 称 为 “直观 的 ”或 “朴素 的 ”集合 论 
进行 一 个 简短 而 基本 的 介绍 ; 更 详细 的 分 析 可 见 朴素 集合 论 。 对 集合 
进行 严格 的 公理 推导 可 见 公理 化 集合 论 。 


在 计算 机 中 集合 是 什么 呢 ? 自 维基 百科 是 这 么 说 的 


在 计算 机 科学 中 ， 集 合 是 一 组 可 变数 量 的 数据 项 (也 可 能 是 0 个 ) 的 组 
合 ， 这 些 数据 项 可 能 共 至 某 些 特征 ， 需 要 以 某 种 操作 方式 一 起 进行 操 
作 。 一 般 来 讲 ， 这 些 数 据 项 的 类 型 是 相同 的 ， 或 基 类 相同 (者 使 用 的 
语言 支持 继承 ) 。 列 表 (或 数组 ) 通常 不 被 认为 是 集合 ， 因 为 其 大 小 
固定 ， 但 事实 上 它 和 常常 在 实现 中 作为 某 些 形式 的 集合 使 用 。 


集合 的 种 类 包括 列表 、 集 、 多 重 集 、 树 和 图 。 枚 举 类 型 可 以 是 列表 或 


集 。 


1.11.4 不 变 的 集合 


以 setO 创 立 的 集合 都 是 可 原 地 修改 的 集合 ， 或 者 说 是 可 变 的 ， 也 可 以 


说 是 unhashable 。 
还 有 一 种 集合 不 能 原 地 修改 ， 这 种 集合 的 创建 方法 是 用 frozenset()， 顾 


名 思 义 ， 这 是 一 个 被 “冻结 ”的 集合 ， 当 然 是 不 能 修改 的 ， 这 种 集合 就 
是 hashable 类 型 可 哈 希 。 


>>> f_set = frozenset("qiwsir") 
>>> f_set 
frozenset{[ 对 "i SY; "rr WwW] 
>>> f_set.add("python") # 报 错 ， 不 能 修改 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


AttributeError: 'frozenset' object has no attribute 'add' 


>>> a_set = set("github") # 对 比 看 一 看 
>>> a_set 
set(['b', ‘gr, i, rh, ru', ct) 


>>> a_set.add("python") 


1.11.5 ”集合 运算 

唤醒 中 学 数学 (准确 说 是 高 中 数学 中 的 一 点 知识 ) 中 关于 集合 的 知 
识 ， 当 然 ， 如 果 你 是 某 个 理工 科 的 专业 大 学 毕业 ， 应 该 更 熟悉 集合 
间 的 关系 。 

1. 元 素 与 集合 的 关系 

元 素 与 集合 就 一 种 关系 ， 要 么 属于 某 个 集合 ， 要 么 不 属于 。 


>>> aset 


set(['h', ‘or, in', pt 'y']) 
"a”" in aset 
False 


2. 集 合 与 集合 的 关系 
假设 两 个 集合 A、B 
(1) A 是 否 等 于 B， 即 两 个 集合 的 元 素 是 否 完全 一 样 。 


在 交互 模式 下 实验 


(2) A 是 否 是 B 的 子 集 ， 或 者 反 过 来 ，B 是 否 是 A 的 超 集 ， 即 A 的 元 素 
是 否 也 都 是 B 的 元 素 ， 且 B 的 元 素 比 A 的 元 素数 量 多 。 


判断 集合 A 是 否 是 集合 B 的 子 集 ， 可 以 使 用 A<B， 返 回 True 则 是 子 集 ， 
否则 不 是 。 另 外 ， 还 可 以 使 用 函数 A.issubset (B) 判断 。 


>>> a 


set(['q', ri, ‘sr, rr', rw']) 
>>> C 

set(['q', 'i']) 

>>>c<a #c 是 a 的 子 集 


True 


>>> c.issubset(a) # 或 者 用 这 种 方法 ， 判 断 c 是 否 是 a 的 子 集 
True 

>>> a.issuperset(c) # 判 断 a 是 否 是 c 的 超 集 

True 

>>> b 


settle Tq 
>>>a<b #a 不 是 b 的 子 集 
False 

>>> a.issubset(b) 


False 


(3) A、B 的 并 集 ， 即 A、B 所 有 元 素 ， 如 图 1-8 所 示 。 


A B AUB 


图 1-8 A、B 的 并 集 


可 以 使 用 的 符号 是 “*， 是 一 个 半角 状态 下 的 晤 线 ， 输 入 方法 十 在 英文 
状态 下 ， 按 下 “shift* 加 上 右 方 括号 右边 的 那个 键 。 表 达 式 是 A|B 也 可 使 
用 函数 A.union (B) ， 得 到 的 结果 就 是 两 个 集合 并 集 ， 注 意 ， 这 个 结 
果 是 新 生成 的 一 个 对 象 ， 不 是 将 结合 A 扩充 。 


>>> a 


set( [dy i ST ry SW] 

>>> b 

set( [a Sq hy ly on] 

>>> a | b # 可 以 有 两 种 方式 ， 结 果 一 样 
set([' a "dn Ly SO. Tq tS. Ty MW] 

>>> a.union(b) 


set(['a', ‘i', ‘1', 'o', 'q', 's', 'r', 'w']) 


(4) A、B 的 交集 ， 即 A、B 所 公有 的 元 素 ， 如 图 1-9 所 示 。 


A B A 门 了 B 


图 1-9 ”A、B 的 交集 


wx 

Sptt ld dr Sr SW) 

>>> b 

Sott Ea Tq 0 

>>> a&b # 两 种 方式 ， 等 价 
set(['q', 'i']) 

>>> a.intersection(b) 


我 在 实验 的 时 候 ， 顺 手 裔 了 下 面 的 代码 ， 出 现 的 结果 如 下 ， 读 者 能 解 
释 一 下 吗 ? 


>>> a and b 


set(['a', 'q', ‘i', '1', '0']) 


(5) A 相对 B 的 差 ( 补 ) ， 即 A 相对 B 不 同 的 部 分 元 素 ， 如 图 1-10 所 
2 


A B A=B 


图 1-10 ”A 相对 B 的 差 ( 补 ) 


>>> a 
set(['q', ‘i', 's', 'r', 'w']) 


>>> b 


set(['s 'r', 'w']) 
>> a.difference(b) 


set(['s 'r', 'w']) 


(6) A、B 的 对 称 差 集 ， 如 图 1-11 所 示 。 


B=A AAAB 


图 1-11 A、B 的 对 称 差 集 


> ° 在 编程 中 如 采用 到 ， 可 以 用 前 面 说 的 方法 查 


第 2 章 ”语句 和 文件 


“ 呀 呀 学 语 ? 是 小 孩子 成 长 的 必 经 阶段 ， 学 习 编 程 ， 到 这 里 束 是 “ 呀 呀 学 
语 ” 的 阶段 。 从 本 章 开 始 ， 将 使 用 已 经 学 习 过 的 基本 知识 ， 组 朔 成 各 种 
语句 ， 通 过 语句 同 计算 机 传达 目 己 的 意愿 。 所以， 读者 将 从 本 章 收 获 
到 “ 呀 呀 学 语 ” 的 回忆 。 


1 二 党 人 


在 编程 语言 中 运算 符 是 比较 多 样 化 的 ， 虽 然 已 经 在 前 面 了 解 了 各 种 运 
算 符 和 其 优先 级 ， 但 是 ， 那 时 对 Python 的 理解 还 比较 肤浅 ， 现 在 要 温 


故而 知 新 ， 更 上 一 层 楼 。 
2 算术 运算 条 


四 则 运算 中 的 一 些 运算 符 ， 如 加 减 乘除 ， 对 应 的 符号 分 别 是 : +、-、 
*、/， 此 外 ， 还 有 求 余数 的 “%"? 等 ， 都 是 算术 运算 符 。 

列 出 一 个 表格 ， 将 所 有 的 运算 符 表 现 出 来 。 不 用 记 ， 但 是 要 认真 地 看 
一 看 ， 知 道 有 哪些 ， 如 采 以 后 用 到 ， 可 以 来 得 ， 如 表 2-1 所 示 。 


表 2-1 算术 运算 符 


萌 述 实 
， 两 个 对 象 相 加 10+20 输出 结果 30 
减 ， 得 到 负数 或 是 一 个 数 减 去 另 一 个 数 10-20 输出 结果 -10 
&， 两 个 数 相 乘 或 是 返回 一 个 被 重复 若干 次 的 字符 串 10* 20 输出 结果 200 
除 ，x 除 以 y 20/10 输出 结果 2 
取 余 ， 返 回 除法 的 余数 20%10 输出 结果 0 


震 ， 返 回 x 的 了 次 蛇 10**2 输出 结果 100 


取 整 除 ， 返 回 商 的 整数 部 分 9/2 输出 结果 4 .9.0//2.0 输出 结果 4.0 


读者 可 以 根据 中 学 的 数学 知识 ， 想 想 上 面 的 运算 符 在 混合 运算 中 应 该 
按照 什么 顺序 计算 ， 并 且 末 目 斌 起， 是 否 与 中 学 数学 中 的 规律 一 致 。 


2.12 此 入 运 和 所 得 


所 谓 比 较 ， 避 是 将 两 个 东西 相 比 ， 比 如 做 家 长 的 经 常 把 目 己 的 孩子 跟 
别人 的 孩子 比较 ， 唯 杂 目 己 的 孩子 在 某 方面 差 了 。 


在 计算 机 高 级 语言 编程 中 ， 任 何 两 个 同一 类 型 的 量 都 可 以 进行 比较 ， 
比如 两 个 数字 可 以 比较 ， 两 个 字符 串 可 以 比较 。 不 同类 型 的 量 可 以 比 
较 吗 ? 这 种 比较 没有 意义 ， 比 如 ， 二 两 肉 和 三 尺 布 如 何 进行 比较 ? 所 
以 ， 在 真正 的 编程 中 ， 我 们 要 谨慎 对 待 这 种 不 同类 型 量 的 比较 。 


但 是 ， 在 茶 些 语言 中 ， 人 允许 这 种 比较 ， 因 为 它们 在 比较 的 时 候 ， 都 是 
将 非 数值 类 型 转化 为 数值 类 型 比较 。 


对 于 比较 运算 符 ， 在 小 学 数学 中 就 学 习 了 一 些 ， 大 于 、 小 于 、 等 于 、 
不 等 于 。 没 有 陌生 的 东西 ，Python 里 面 也 是 如 此 ， 如 表 2-2 所 示 。 


以 下 假设 变量 a 为 10， 变 量 b 为 20。 
表 2-2 ”比较 运算 符 


实 例 


(a 一 b) 返回 False 


等 于 (注意 ， 两 个 符号 ) 
不 等 于 
大 于 
小 于 
大 于 等 于 
小 于 等 于 


(a !=b) 返回 True 


a>b) 返回 False 


a<b) 返回 True 


(a>=b) 返回 False 


a =b) 返回 Tme 


在 表 2-2 中 ， 显 示 比 较 的 结果 就 是 返回 True 或 者 False， 有 即 这 个 比较 如 果 
成 立 ， 束 为 真 ， 返回 True， 若 返回 False， 则 说 明 比 较 不 成 立 。 


请 按照 下 面 的 方式 进行 比较 操作 ， 然 后 再 根据 目 己 的 想象 进行 练习 。 


除了 数字 之 外 ， 还 可 以 对 字符 串 进 行 比较 。 字 符 串 中 的 比较 是 按照 <“ 字 
典 有 顺序? 进行 比较 的 ， 当 然 ， 这 里 说 的 是 英文 的 字典 。 


>>> a = "qiwsir" 
>>> b = "python" 
>>> a > b 


True 


先 看 第 一 个 字符 ， 按 照 字 典 顺序 ，q 大 于 p (在 字典 中 ，q 排 在 p 的 后 
面 ) ， 那 么 就 返回 结果 True 。 


在 Python 中 ， 某 些 两 种 不 同类 型 的 对 象 ， 虽 然 可 以 进行 比较 ， 但 是 不 
委 成 这 样 进行 比较 。 


目 先 谈 谈 什么 是 逻辑 ， 韩 宕 先生 对 逻辑 有 一 个 分 类 : 
逻辑 分 两 种 ， 一 种 是 逻辑 ， 男 一 种 是 中 国人 的 逻辑 。 


这 种 分 类 的 确 非 党 精准 。 在 很 多 情况 下 ， 中 国人 有 很 奇特 的 逻辑 。 但 
征 ， 在 Python 中 ， 讲 的 是 逻辑 ， 不 是 中 国人 的 逻辑 。 

逻辑 (logic) ， 又 称 理 则 、 论 理 、 推 理 、 推 论 ， 是 有 效 推论 的 哲学 研 
完 。 逮 辑 被 使 用 在 大 部 分 智能 活动 中 ， 但 主要 在 哲学 、 数 学 、 语 义学 
和 计算 机 科学 等 领域 内 被 视 为 一 门 学 科 。 在 数学 里 ， 逻 辑 足 指 研 究 某 
个 形式 语言 的 有 效 推论 。 

1. 布 尔 类 型 的 变量 

在 所 有 的 高 级 编程 语言 中 都 有 一 类 对 象 类 型 ， 被 称 之 为 布尔 型 ， 这 是 
用 一 个 人 的 名 字 来 命名 的 。 


治 - 布 尔 (George Boole，1815 年 一 1864 年 ) ， 英 格 兰 数学 家 、 哲 学 


冰 江水 


F 治 :布尔 是 一 个 皮 匠 的 儿子 ， 生 于 英格兰 的 林肯 。 由 于 家 境 贡 寒 ， 布 
处 不 得 不 在 协助 养家 的 同时 为 目 己 能 受 教 育 而 奋斗 ， 不 管 怎 么 说 ， 他 
成 了 19 世 纪 和 最 重要 的 数学 家 之 一 。 尽管 他 考虑 过 以 牧师 为 业 ， 但 最 终 
还 十 决定 从 教 ， 而 且 不 久 殊 开办 了 目 己 的 学 校 。 


在 备课 的 上 时候， 布尔 不 满意 当时 的 数学 课本 ， 便 决定 阅读 伟大 数学 家 
的 论文 。 在 阅读 伟大 的 法 国 数学 家 拉 格 朗 日 的 论文 时 ， 布 尔 有 了 变 分 
法 方面 的 新 发 现 。 变 分 法 是 数学 分 析 的 分 支 ， 它 处 理 的 是 寻求 优化 某 
些 参数 的 曲线 和 曲面 。 


1848 年 ， 布 尔 出 版 了 《The Mathematical Analysis of Logic》 ， 这 是 他 
对 符号 逻辑 诸多 页 献 中 的 第 一 次 。 


1849 年 ， 他 被 任命 于 爱尔兰 科 克 的 旦 后 学 院 ( 今 科 元 大 学 或 UCC) 的 
数学 教授 。1854 年 ， 他 出 版 了 《The Laws of Thought》， 这 是 他 最 著 
名 的 著作 。 在 这 本 书 中 布尔 介绍 了 以 他 的 名 字 命 名 的 布尔 代数 。 布 尔 
0 这 些 课本 在 英国 一 直 使 用 到 19 世 


由 于 其 在 符号 逻辑 运算 中 的 特殊 页 献 ， 很 多 计算 机 语言 中 将 逻辑 运算 
称 为 布尔 运算 ， 将 其 结果 称 为 布尔 值 。 

布尔 所 创立 的 这 套 逻 辑 被 称 之 为 "布尔 代数 "， 其 中 规定 只 有 两 种 值 ， 
True 和 False， 正 好 对 应 计算 机 上 二 进 制 数 的 1 和 0。 所 以 ， 布 尔 代数 和 
计算 机 是 天 然 吻合 的 。 

所 谓 布尔 类 型 就 是 返回 结果 为 1 (True) 或 0 (False) 的 数据 变量 。 


在 Python 中 《其 他 高 级 语言 也 类 似 ) 有 三 种 运算 符 ， 可 以 实现 布尔 类 
型 的 对 象 间 的 运算 。 


2. 布 尔 运算 


布尔 运算 符 如 表 2-3 所 示 。 


表 2-3 布尔 运算 符 


(1) and 


and， 翻 译 为 “与 "， 但 事实 上 ， 这 种 翻译 容易 引起 望 文生 义 的 理解 。 先 
说 一 下 正确 的 理解 。A and B， 含 义 是 : 首先 运算 A， 如 果 A 的 值 是 
True， 就 计算 B， 并 将 B 的 结果 返回 做 为 最 终结 果 〈 如 果 B 是 False， 那 
么 AandB 的 最 终结 果 就 是 False， 如 果 B 的 结果 是 True， 那 么 AandB 的 
结果 就 是 True) ; 如 果 A 的 值 是 False， 就 不 计算 B 了 ， 直 接 返 回 False 作 
为 A and B 的 结果 。 


比如 : 


4>3 and 4<9， 首 先 看 4>3 的 值 ， 这 个 值 是 True， 再 看 4<9 的 值 ， 是 
True， 那 么 最 终 这 个 表达 式 的 结果 为 True。 


>>> 4>3and4<9 


True 


4>3 and 4<2， 先 看 4>3， 返 回 True， 再 看 4<2， 返 回 的 是 False， 那 么 最 
终结 果 是 False。 


>>>4>3and4<2 


False 


4<3 and 4<9， 先 看 4<3， 返 回 为 False， 就 不 看 后 面 的 了 ， 直 接 返 回 这 
(对 这 种 现象 ， 有 一 个 形象 的 说 法 ， 叫 作 “ 短 


>>> 4<3and4<2 


False 


前 面 说 容易 引起 望 文 生 义 的 理解 ， 就 是 有 很 多 人 认为 无 论 什 么 时 候 都 
看 and 两 边 的 值 ， 知 值 都 是 True 则 返回 True， 大 有 一 个 是 False 就 返回 
False。 根 据 这 种 理解 得 到 的 结果 与 前 述 理解 得 到 的 结果 一 样 ， 但 是 ， 


运算 量 不 一 样 。 
(2) or 


or， 翻 译 为 "或 ”。 在 A orB 中 ， 它 是 这 么 运算 的 : 


if A == True: 


上 面 这 段 算是 伪 代 码 ， 所 谓 伪 代 码 ， 束 不 是 真正 的 代码 ， 无 法 运行 。 
但 是 ， 伪 代码 也 有 用 途 ， 残 是 能 够 以 类 似 代码 的 方式 表达 一 种 计算 过 
程 。 本 书 读者 应 该 能 对 这 上 段 伪 代 码 有 一 个 大 概 的 理解 。 


下 面 再 加 上 每 行 的 注释 。 这 个 伪 代 码 跟 目 然 的 英语 差不多 了 。 


if A==True: # 如 果 A 的 值 是 True 


return True # 返 回 True， 表 达 式 最 终结 果 是 True 
else: # 和 否则， 也 就 是 A 的 值 不 是 True 
return B # 看 B 的 值 ， 然 后 就 返回 B 的 值 作为 最 终结 果 


根据 上 面 的 运算 过 程 举例 。 


>>> 4<3or4<9 
True 

>>> 4<3or 4>9 
False 

>>> 4> 3or 4>9 


True 


(3) not 
not， 翻 译 成 “ 非 "*， 镭 以 为 非常 好 ， 不 论 面 对 什 么 ， 就 是 要 否定 它 。 


>>> not(4>3) 
False 


>>> not(4<3) 


True 


关于 运算 符 问 题 ， 其 实 不 止 上 面 这 些 ， 比 如 还 有 成 员 运 算 符 in， 在 后 
面 的 学 习 中 会 逐渐 过 到 。 


2.2 ”人 简单 语句 


学 习 编 程序 ， 束 好 比 小 学 生 学 习 写作 一 样 ， 先 学 会 一 些 词语 ， 整 等同 
于 已 经 掌握 了 基本 的 对 象 类 型 ， 接 下 来 就是 学 “造句 子 ” 的 时 候 了 。 


在 编程 语言 中 ， 人 句子 被 称 之 为 “语句 ”。 


事实 上 ， 前 面 已 经 用 过 语句 了 ， 最 典型 的 print"Hello，World" 束 是 语 
他 
为 了 能 够 瑚 谨 地 阐述 这 个 概念 ， 抄 一 段 维基 百科 中 的 词 条 : 命令 式 纺 
程 。 


命令 式 编程 (英语 : Imperative programming) ， 是 一 种 描述 电脑 所 需 


做 出 的 行为 的 编程 范 型 。 几 乎 所 有 电脑 的 硬件 工作 都 是 指令 式 的 ; 几 


乎 所 有 电脑 的 硬件 都 是 设计 来 运行 机 器 码 ， 使 用 指令 式 的 风格 来 写 
的 较 高 级 的 指令 式 纺 各 语言 使 用 变量 和 更 复杂 的 语句 ， 但 仍 做 从 
司 的 范 型 。 


运算 语句 一 般 来 说 都 表现 了 在 存储 器 内 的 数据 进行 运算 的 行为 ， 然 后 
将 结 采 存 入 存储 器 中 以 便 日 后 使 用 。 高 级 命令 式 编 程 语 言 更 能 处 理 复 
杂 的 表达 式 ， 可 能 会 产生 四 则 运算 和 函数 计算 的 结合 。 
一 般 高 级 语言 都 包含 如 下 语句 ，Python 也 不 例外 。 

(1) 循环 语句 : 容许 一 些 语句 反复 运行 数 次 。 可 依据 一 个 默认 的 数目 
来 决定 运行 这 些 语句 的 执行 次 数 ; 或 反复 运行 它们 ， 直 至 某 些 条 件 改 


之 


(2) 条 件 语句 : 容许 仅 当 茶 些 条 件 成 立时 才 运行 某 个 区 块 。 和 否则， 这 
个 区 块 中 的 语句 会 略 去 ， 然 后 按 区 块 后 的 语句 继续 运行 。 


(3) 无 条 件 分 支 语句 :容许 运行 顺序 转移 到 程序 的 其 他 部 分 之 中 。 包 
括 跳 跃 〈 在 很 多 语言 中 称 为 Goto) 、 副 程序 和 Procedure 等 。 


循环 、 条 件 分 文 和 无 条 件 分 文 都 生 控 制 流程 。 


当然 ，Python 中 的 语句 还 是 有 目 己 的 特别 之 处 的 〈 别 的 语言 也 有 目 己 
的 特色 ) 。 下 面 束 开始 妮 九 道 来 。 


2.2.1 print 


在 Python 2.x 中 ，Pprint 是 一 个 语句 ， 但 是 在 Python 3.x 中 它 践 是 一 个 函 
数 了 。 不 过 ， 这 里 所 演示 的 还 是 Python 2.x。 


print 发 起 的 语句 ， 在 程序 中 主要 是 将 某 些 东西 打印 出 来 ， 还 记得 在 字 
符 串 的 格式 化 输出 吗 ? 那 束 是 用 来 print 的 。 


>>> print "hello, world" 


hello, world 
>>> print "hello", "world" 


hello world 


请 仔细 观察 上 面 两 个 print 语 句 的 差别 。 第 一 个 打印 的 是 “hello， 

world”， 包 括 其 中 的 逗号 和 空格 ， 是 一 个 完整 的 字符 串 。 第 二 个 打印 
的 是 两 个 字符 串 ， 一 个 是 “hello”， 男 外 一 个 是 “world”， 两 个 字符 串 之 
间 用 过 号 分 隔 。 


本 来 ， 在 print 语 句 中 ， 字 符 串 后 面 会 接 一 个 mn 符号 ， 即 换行 。 但 是 ， 
如 果 要 在 一 个 字符 串 后 面 跟着 逗号 ， 那 么 换行 就 取消 了 ， 和 意味 着 两 个 
字符 串 “hello” 和 “world” 打 印 在 同一 行 。 

或 许 现在 体现 得 还 不 是 很 明显 ， 换 一 个 方法 就 显示 出 来 了 。 (下 面 用 
到 了 一 个 称 为 for 循 环 的 语句 ， 后 面 要 详细 讲述 。) 


we For 1 in [ii23 a5]: 


print i 
于 
2 
3 
4 
5 


这 个 循环 的 意思 就 是 要 从 列表 中 依次 取出 每 个 元 素 ， 然 后 赋值 给 变量 
i， 并 用 print 语 名 打印 打出 来 。 在 变量 i 后 面 没有 任何 符号 ， 每 打印 一 个 
就 换行 ， 再 打印 下 一 个 ， 这 就 是 那个 "nz 起 的 作用 。 


下 面 的 方式 惑 跟 上 面 的 有 点 区 别 了 。 


2 


在 print 语 句 的 最 后 加 了 一 个 有 逗号， 打印 出 来 的 就 在 一 行 了 。 


print 语 句 经 常用 在 调试 程序 的 过 程 ， 让 我 们 能 够 知道 程序 在 执行 过 程 
7 和 二 风 第 来 


2.2.2 import 


曾经 用 到 过 一 个 Python 标 准 库 math， 它 能 提供 很 多 数学 函数 ， 但 是 这 
些 函 数 不 是 Python 的 内 建 函 数 ， 而 是 属于 math 的 ， 所 以 ， 要 用 import 


math 来 引入 这 个 标准 库 。 


这 种 用 import 引 入 模块 〈 或 者 库 、 包 ) 的 方法 是 Python 编程 经 常用 到 
的 。 引 用 方法 有 如 下 几 种 : 


>>> import math 
>>> math.pow(3,2) 


5 


这 是 常用 的 一 种 方式 ， 而 且 非 常 明确 ，math.pow \3，2) 就 明确 显示 
了 ，pow0 函 数 是 math 模 块 里 的 。 可 以 说 这 是 一 种 可 该 性 非常 好 的 引用 
方式 ， 并 且 不 同 模块 的 同名 函数 不 会 产生 冲突 。 


>>> from math import pow 


>>> pow(3,2) 


9.0 


这 种 方法 就 有 点 偷懒 了 ， 不 过 也 不 难 理解 ， 从 字面 意思 就 知道 pow() 孙 
数 来 日 于 math 模 块 。 在 后 续 使 用 的 时 候 ， 只 需要 直接 使 用 pow() 即 可 ， 
不 需要 在 前 面 写 上 模块 名 称 了 。 这 种 引用 方法 ， 比 较 适 合 于 引入 模块 
较 少 的 时 候 。 如 琳 引 入 模块 多 了 ， 可 读 性 整 下 降 了 ， 会 不 知道 哪个 函 
数 来 目 哪 个 模块 。 


>>> from math import pow as pingfang 


>>> pingfang(3,2) 


35 


这 是 在 前 面 基础 上 的 发 展 ， 把 从 某 个 模块 引入 的 函数 重新 命名 ， 比 如 
讲 pow 重 命名 为 pingfang， 然 后 使 用 pingfangO 就 相当 于 使 用 powO 了 。 


还 会 遇 到 要 引入 多 个 函数 的 情况 ， 可 以 这 样 做 : 


>>> from math import pow, e, pi 


>>> pow(e, pi) 


引入 了 math 模 块 里 面 的 pow、e、pi，pow0 是 一 个 乘 方 画 数 ，e 就 是 欧 
拉 数 ，pi 束 是 fr。 


e， 作 为 数学 和 常数， 是 目 然 对 数 画 数 的 压 数 。 有 时 称 它 为 欧 拉 数 
(Euler's number) ， 以 瑞士 数学 家 欧 拉 命名 ， 还 有 个 较 鲜 见 的 名 字 是 


纳 皮尔 常数 ， 以 纪念 苏格兰 数学 家 约翰 : 纳 皮尔 引进 对 数 。 它 是 一 个 无 
限 不 循环 小 数 。e=2.71828182845904523536 (《 维 基 百 科 》) 


e 的 nt 次 方 ， 是 一 个 数学 常数 ， 与 e 和 7 一 样 是 一 个 超越 数 。 这 个 常数 在 
希 尔 伯 特 第 七 问题 中 曾 提 到 过 。 ( 《维基 百科 》)) 


>>> from math import * 
>>> pow(3,2) 

:8 

>>> sqrt(9) 


3.0 


这 种 引入 方式 是 最 省 事 的 了 ， 一 下 将 math 中 的 所 有 函数 都 引 过 来 

了 。“ 好 事 成 双 ” 往 往 都 是 梦想 ， 这 样 引 入 模块 中 的 函数 ， 其 可 读 性 难 
人 免 降低 了 ， 一 般 适 用 于 模块 中 的 函数 比较 少 的 时 候 ， 并 且 在 程序 中 应 
用 比较 频 和 党 的 情况 。 


以 上 用 math 模 块 为 例 ， 引 入 其 中 的 函数 ， 其 实在 编程 中 ， 各 样 的 对 象 
都 可 以 引入 。 


2.2.3 ”赋值 


大 家 对 于 赋值 语句 应 该 不 卫生 ， 在 前 面 已 经 频 壹 使 用 了 ， 如 a=3 这 样 
的 ， 台 是 将 一 个 整数 赋 给 了 变量 。 


编程 中 的 “=” 和 数学 中 的 “=” 钙 完全 不 同 的 。 在 编程 语言 中 ,，“=” 表 示 赋 
值 过 程 。 


除了 那 种 最 向 单 的 赋值 之 外 ， 还 可 以 这 么 做 : 


> x, y, z = 1, "python", ["hello", "world"] 


>>> y 


"python' 


['hello', 'world'] 


这 里 丈 一 一 对 应 赋值 了 。 如 末 把 几 个 值 赋 给 一 个 ， 可 以 吗 ? 


>>> a = "itdiffer.com", "python" 


('itdiffer.com', "python ') 


原来 是 将 右边 的 两 个 值 故 入 了 一 个 元 组 ， 然 后 将 元 组 赋 给 了 变量 a 。 
Python 太 聪明 了 。 


在 Python 的 赋值 语句 中 ， 还 有 更 聪明 的 。 


有 两 个 变量 ， 其 中 a=2，b=9。 现 在 想 让 这 两 个 变量 的 值 对 调 ， 即 最 终 
日 
征 a=9，b=2。 


这 十 一 个 简单 而 经 典 的 题目 。 在 很 多 编程 语言 中 ， 征 这 样 处 理 的 : 


在 这 里 变量 束 如 同一 个 盒子 ， 值 就 如 同 放 到 盒子 里 面 的 东西 。 如 采 要 
实现 对 调 ， 必 须 再 找 一 个 盒子 ， 将 a 盒子 里 面 的 东西 (数字 2) 拿 到 那 
个 临时 盒子 (temp) 中 ， 这 样 a 盒子 就 空 了 ， 然 后 将 b 盒 子 中 的 东西 
(数字 9) 拿 到 a 盒子 中 (a=b) ， 完 成 这 步 之 后 ，b 盒 子 是 空 的 了 ， 最 
盒子 里 面 的 那个 数字 2 拿 到 b 盒 子 中 。 这 就 实现 了 两 个 变量 值 
对调。 


Python 只 要 一 行 就 完成 了 。 


a，b=b，a 就 实现 了 数值 对 调 ， 多 么 神奇 。 之 所 以 神奇 ， 是 因为 前 面 已 
经 数 次 提 到 的 Python 中 变量 和 数据 对 象 的 关系 。 变 量 相当 于 贴 在 对 象 
目的 本 签 ， 这 个 操作 只 不 过 是 将 标 答 换个 位 置 ， 训 分 别 指向 了 不 同 的 
数据 对 象 。 


还 有 一 种 赋值 方式 ， 被 称 为 “ 链 式 赋值 ”。 


n= "I use python" 
>>> print m, n 


I use python I use python 


用 这 种 方式 实现 了 一 次 性 对 两 个 变量 赋值 ， 并 且 值 相 同 。 


>>> id(m) 
3072659528L 
>>> id(n) 


3072659528L 


用 id0 来 检查 一 下 ， 发 现 两 个 变量 所 指向 的 是 同一 个 对 象 。 


另外， 还 有 一 种 判断 方法 ， 可 以 检查 两 个 变量 所 指向 的 值 是 否 钙 同 
同一 个 和 相等 症 有 差别 的 。 在 编程 中 ， 同 一 个 融 是 id0 的 结 


True 


这 征 在 检查 mm 和 mn 分别 指 辐 的 对 象 是 否 是 同一 个 ，True 说 明 是 同一 个 。 


这 跟 上 面 的 链 式 赋值 是 等 效 的 。 
日 


一 


日 
AE: 


>>> id(a) 
3072659608L 
>>> id(b) 


3072659568L 


J = 


True 


看 出 其 中 的 端倪 了 吗 ? 这 次 a、b 两 个 变量 虽然 相等 ， 但 不 是 指 问 同 一 


个 对 象 。 


还 有 一 种 赋值 形式 ， 如 果 从 数学 的 角度 看 和 是 不 可 思议 的 ， 如 X=X+1， 
在 数学 中 ， 这 个 等 式 是 不 成 立 的 ， 因 为 数学 中 的 “=? 是 等 于 的 含义 ， 但 
征 在 编程 语言 中 成 立 ， 因 为 “=” 是 赋值 的 含义 ， 即 将 变量 x 增 加 1 之 后 ， 
再 把 得 到 的 结 末 赋 给 变量 x 。 

这 种 变量 目 己 变 化 之 后 将 结 采 再 赋值 给 目 己 的 形式 ， 称 为 “ 增 量 赋 

值 ”。+、-、*、/ 八 % 都 可 以 实现 这 种 操作 。 


为 了 让 这 个 操作 写 起 来 省 点 事 儿 ， 可 以 写成 : x+=1， 如 


>> X = 9 


10 


除了 数字 ， 在 实际 中 字符 串 进 行 增 量 赋值 也 很 有 价值 。 


>> m = "py" 
“4 "Eh" 


"pyth' 


"python' 


2.3 条件 语句 


条 件 ， 是 日 常生 活 中 经 常见 到 的 ， 比 如 你 给 某 个 公司 干 活 ， 条 件 是 他 
文 付 薪水 。 所 以 ， 条 件 语句 ， 也 见 诸 各 种 高 级 编程 语言 。 


2.3.1 证 语句 


if 语句 是 由 if 发 起 的 一 个 语句 ， 即 if 发 起 是 一 个 条 件 ， 在 满足 此 条 件 后 
执行 相应 的 内 容 。f 文 个 单词 就 是 构成 条 件 语句 的 关键 词 。 


在 交互 模式 下 ， 人 简单 书写 一 下 if 发 起 的 条 件 语句 。 特 别 说 明 ， 在 交互 
模式 中 写 稍 微 长 一 点 的 程序 ， 本 身 不 值得 提倡 ， 此 处 只 是 为 了 演示 。 
如 采 你 要 写 大 段 的 代码 ， 千 万 不 要 在 交互 模式 下 写 。 


if a==8: 这 人 句 话 里 面 如 果 条 件 a==8 返 回 的 是 True， 那 么 就 执行 下 面 的 语 
句 。 此 语句 最 后 的 冒号 是 必需 的 ， 下 面 一 行 语句 print a 要 有 四 个 空格 
的 缩 进 。 这 是 Python 的 特点 ， 称 之 为 语句 块 。 


唯 钨 说 得 不 闻 谍 ， 我 还 是 引用 维基 百科 中 的 禾 述 : 


Python 开发 者 有 意 让 违反 了 缩 排 规则 的 程序 不 能 通过 编译 ， 以 此 来 强 

迫 程序 员 养 成 民 好 的 编程 习惯 。 并 且 Python 语言 利用 缩 排 表 示 语 句 块 

的 开始 和 结束 (Off-side 规 则 ) ， 而 非 使 用 花 括 号 或 者 某 种 关键 词 。 增 
加 缩 排 表 示 语 句 块 的 开始 ， 而 减少 缩 排 则 表示 语句 块 的 结束 。 缩 排 成 
为 了 语法 的 一 部 分 ， 例 如 if 语 句 。 


根据 PEP 的 规定 ， 必 须 使 用 四 个 空格 来 表示 每 级 缩 排 。 使 用 Tab 字 符 和 
其 他 数目 的 空格 虽然 都 可 以 编译 通过 ， 但 不 符合 编码 规范 。 支 持 Tab 子 
0 目的 空格 仅仅 是 为 兼容 很 旧 的 Python 程序 和 某 些 有 问题 的 
编辑 程序 。 


从 上 面 的 这 段 话 中 ， 提 和 炼 出 儿 个 必需 的 要 求 : 
。 必须 要 通过 缩 进 方式 来 表示 语句 块 的 开始 和 结束 。 
。 缩 进 用 四 个 空格 (也 是 必需 的 ， 别 的 方式 或 许 也 可 以 ， 但 不 提 


倡 ) 


2.3.2 if...elif...else 
候 ， 只 有 if 往往 是 不 够 的 。 看 如 图 2-1 所 示 的 流 


number number 
more than 10 you are smart 


图 2-1 流程 


这 张 图 反映 的 是 这 样 一 个 问题 : 
输入 一 个 数字 ， 并 输出 输入 的 结果 。 如 采 这 个 数字 大 于 10， 那 么 输出 


提示 大 于 10; 如 果 小 于 10， 则 输出 提示 小 于 10; 如 果 等 于 10， 束 输出 
表示 表扬 的 一 句 话 。 


从 图 中 束 已 经 显示 出 来 了 ， 对 一 个 值 的 判断 结 采 有 三 个 分 文 ， 为 了 解 
决 多 分 文 的 问题 ， 就 引入 男 外 一 种 条 件 判 断 ，if...elif...else 语 句 。 


基本 样式 结构 : 


if 条 件 1: 


语句 块 1 


elif 条 件 2 : 
语句 块 2 
elif 条 件 3: 


语句 块 3 


人 Se 


语句 块 4 


elif 用 于 多 个 条 件 时 ， 也 可 以 没有 。 那 吏 回 归 到 计 了 。 
下 面 吏 不 在 交互 模式 中 写 代 码 了 。 打 开 你 的 编辑 部 ， 代 码 实例 如 下 : 


#! /usr/bin/env python 


#coding:utf-8 
print "请 输入 任意 一 个 整数 数字 : " 


number = int(raw_input()) # 通 过 raw_input( ) 输 入 的 数字 是 字符 串 


# 用 int() 将 该 字符 串 转化 为 整数 


if number == 10: 
print "您 输入 的 数字 是 : %d" % number 
print "You are SMART ." 
elif number > 10: 
print "您 输入 的 数字 是 : %d" % number 
print "This number is more than 10." 
elif number < 10: 
print "您 输入 的 数字 是 : %d" % number 


print "This number is less than 10." 


raw_input() 芳 数 获得 用 户 在 界面 上 输入 的 信息 ， 而 通过 它 得 到 的 虽然 
人 但 它 是 字符 串 类 型 的 ， 所 以 要 转化 为 整数 型 ， 才 能 用 于 后 面 
、 A oO 


上 壕 程 序 要 依据 条 件 进行 判断 ， 在 不 同 条 件 下 做 不 同 的 事情 。 需 要 提 
醒 的 是 : 在 条 件 中 ，number==10， 为 了 陪读 方便 ， 在 number 和 == 之 间 
最 好 有 一 个 空格 ， 同 理 ， 后 面 也 有 一 个 。 这 里 的 10 是 int 类 型 ，number 
所 引用 的 对 象 也 是 int 类 型 。 


把 这 段 程序 保存 成 一 个 扩展 名 是 .py 的 文件 ， 我 把 它 保 存 为 num.py， 进 
入 到 存储 这 个 文件 的 目录 ， 运 行 python num.py， 束 能 看 到 程序 执行 结 
果 了 。 下 面 古 我 执行 的 结 采 ， 供 参考 。 


12 


您 输入 的 数字 是 : 12 


This number is more than 10. 


$ python num.py 

请 输入 任意 一 个 整数 数字 
10 

您 输入 的 数字 是 ，10 


You are SMART. 


$ python num.py 
请 输入 任意 一 个 整数 数字 
9 

您 输入 的 数字 是 : 9 


This number is less than 10. 


在 "条 件 * 中 ， 就 是 前 面 已 经 提 到 的 各 种 条 件 运 算 表 达 式 ， 如 果 是 


True， 束 执行 该 条 件 下 的 语句 。 


2.3.3 ”三 元 操作 符 


三 元 操作 ， 是 条 件 语 句 中 比较 简练 的 一 种 赋值 方式 ， 它 的 模样 是 这 样 


的 : 


>>> name = "qiwsir" if "laoqi" else "github" 
>>> name 

"qiwsir' 

>>> name = 'qiwsir' if "" else "python" 

>>> name 

'python' 

>>> name = "qiwsir" if "github" else "" 

>>> name 


总 结 一 下 : A=Y if X else Z 
结合 前 面 的 例子 ， 可 以 看 出 : 


。 如 果 X 为 真 ， 那 么 就 执行 A=Y。 
。 如 果 X 为 假 ， 束 执行 A=Z 。 


如 此 例 : 


>>> X = 2 
>>> yY = 8 


>>> a = "python" if x > y else "qiwsir" 


"qiwsir 
>>> b = "python" if x < y else "qiwsir" 
wx 才 


'python' 


2.4 ”for 循环 

循环 ， 也 是 现实 生活 中 常见 的 现象 ， 我 们 常 说 的 日 复 一 日 就 是 典型 的 
循环 。 又 如 日 月 更 闪 、 斗 转 星 黎 ， 无 不 是 循环 ， 王朝 更 闪 、 子 子孙 
孙 、 索 衍 不 县 ， 从 某 个 角度 看 也 都 是 循环 。 

编程 语言 就 是 要 解决 现实 问题 的 ， 因 此 也 少不了 要 循环 。 


在 Python 中 ， 循 环 之 一 : for 循 环 。 言 外 之 意 ， 还 有 别 的 循环 ， 请 读者 
保持 阅读 的 耐心 ， 继 续 。 
For 循 环 的 基本 结构 是 : 


for 循环 规则 : 
操作 语句 


从 基本 结构 看 ， 其 有 着 同 if 条 件 语 句 类 似 的 地 方 : 都 有 冒号 ;语句 块 
都 要 缩 进 。 有 是 的 ， 这 些 是 不 可 或 缺 的 。 


2.4.1 人 简单 的 for 循 环 
前 面 介 绍 print 语 句 的 时 候 ， 出 现 了 一 个 简单 例子 : 


>>> hello = "world" 


这 个 for 循 环 是 怎么 工作 的 呢 ? 


。 hello 这 个 变量 引用 的 是 “world” 这 个 字符 串 类 型 的 数据 。 


。 变量 ij 通过 “hello" 找 到 它 所 引用 的 对 象 “world”， 因 为 字符 串 类 型 的 
对 象 属于 序列 类 型 ， 能 够 进行 案 引 ， 于 是 就 按照 索引 顺序 ， 从 第 
一 字符 开始 ， 依 次 获得 该 字符 。 

。 当 i="w" 的 时 候 ， 执 行 print i， 打 印 出 了 字母 w， 绪 束 之 后 循环 第 二 
次 ， 让 i="e"， 然 后 执行 print i， 打 印 出 字母 e。 如 此 循环 下 去 ， 一 
直到 最 后 一 个 字符 被 打印 出 来 ， 循 环 目 动 结束 。 注 意 ， 每 次 打印 
之 后 要 换行 。 


因为 也 可 以 通过 使 用 索引 ( 偏 移 量 ) 得 到 序列 对 象 的 某 个 元 素 ， 所 
以 ， 还 可 以 通过 下 面 的 循环 方式 实现 同样 的 效果 : 


>>> for i in range(len(hello)): 


print hello[i] 


1 
d 


其 工作 方式 是 : 


。len (hello) 得 到 hello 引 用 的 字符 串 的 长 度 ， 为 5。 

。range (len (hello) 就 是 range (5) ， 也 就 是 0，1，2，3，4]， 对 
应 着 “world” 每 个 字母 索引 ， 也 可 以 称 之 为 偏 移 量 。 这 里 应 用 了 一 
个 新 的 画 数 range()， 关 于 它 的 用 法 ， 继 续 阅 读 就 能 看 到 了 。 
foriinrange (len (hello) ) 就 相当 于 foriin[0，1，2,，3, 4， 让 
i 依次 等 于 list 中 的 各 个 值 。 当 i=0 时 ， 打 印 hello[0]， 也 就 是 第 一 个 
字符 。 然 后 顺序 循环 下 去 ， 直 到 最 后 一 个 i=4 为 止 。 


以 上 的 循环 举例 中 ， 显 示 了 对 子 符 串 的 子 符 依次 获取 ， 同 时 涉及 了 列 
表 ， 再 看 下 面 对 列 表 的 循环 : 


>>> 1s_line 


['Hello', 'I am qiwsir', 'Welcome you', ''] 


>>> for i in range(len(l1s_line)): 


print ls_line[i] 
Hello 


I am gqiwsir 


Welcome you 


2.4.2 range (start, stop[, step]) 

range0 是 个 内 建 画 数 ， 一 般 形 式 是 range (start，stop[，step]) 。 

要 全 究 清楚 一 些 函 数 (0 特别 是 内 置 函 数 (0 的 功能 ， 建 议 读者 首先 要 明日 
。 因 为 在 Python 中 ， 名 称 不 是 随便 取 的 ， 是 代表 
一 定 意义 的 。 


在 具体 实验 之 前 ， 还 是 按 照 屠 例 ， 摘 抄 一 段 官方 文档 的 原 话 ， 让 我 们 
能 够 深刻 理解 之 : 


This is a versatile function to create lists containing arithmetic 
progressions.It is most often used in for loops.The arguments must be plain 
integers.If the step argument is omitted, it defaults to 1.If the start 
argument is omitted, it defaults to 0.The full form returns a list of plain 
integers[start, starttstep, start+2*step, ...].If step is positive, the last 
element is the largest start+i*step less than stop;if step is negative, the last 
element is the smallest start+i*step greater than stop.step must not be zero 
(or else ValueError is raised) . 


关于 range() 琅 数 注意 以 下 几 点 : 


。 这 个 孙 数 可 以 创建 一 个 数字 元 素 组 成 的 列表 。 

。 这 个 函数 最 稼 用 于 for 循 环 。 

。 函 数 的 参数 必须 是 整数 ， 默 认 从 0 开始 。 返 回 值 是 类 似 [start， 
starttstep，start+2*step，...] 的 列表 。 

。 Step 默认 值 是 1。 如 采 不 写 ， 融 是 按照 此 值 。 

。 如 果 step 是 正 数 ， 返 回 list 的 最 后 的 值 不 包含 stop 值 ， 即 start+istep 
这 个 值 小 于 stop; 如 采 step 是 负数 ，start+istep 的 值 大 于 stop。 

。 step 丰 能 等 于 零 ， 如 有 果 等 于 零 ， 就 报错 。 


再 对 各 个 参数 给 予 详细 解释 。 


。 start: 开始 数值 ， 默 认为 0， 即 如 果 不 写 这 项 ， 承 是 认为 start=0。 

。 stop: 结束 的 数值 ， 必 须要 写 。 

。 Le 变化 的 步 长 ， 默 认 是 1， 即 若 不 写 则 认为 步 长 为 1， 坚 决 不 
0 o 


实验 开始 ， 并 对 照 前 面 所 讲述 的 参数 侣 义 : 


>>> range(9) #stop=9， 别 的 都 没有 写 ， 含 义 就 是 range(9，9，1) 
[9，1，2，3，4，5，6，7，8] # 从 9 开始 ， 步 长 为 1， 直 到 小 于 9 的 那个 数 


>>> range(9，9) 
[9, 1, 2, 3, 4, 5, 6, 7, 8] 
>>> range(90, 9, 1) 


[0, 1, 2, 3, 4, 5, 6, 7, 8] 


>>> range(1, 9) #start=1 


[1, 2, 3, 4, 5, 6, 7, 8] 


>>> range(0, 9, 2) #Step=2, 每 个 元 素 等 于 start+i*step 


[9, 2, 4, 6, 8] 


仅仅 解释 一 下 range (0，9，2) 


。 如果 是 从 0 开始 ， 步 长 为 1， 可 以 写成 range (9) 的 样子 ， 但 是 ， 
如 果 步 长 为 2， 写 成 range (9，2) 的 样子 ， 计 算 机 就 有 点 糊涂 
了 ， 它 会 认为 start=9，stop=2。 所 以 ， 在 步 长 不 为 1 的 时 候 ， 一定 
要 把 start 的 值 也 写 上 。 
start=0，step=2，stop=9。 返 回 的 列表 中 的 第 一 个 值 是 start=0， 人 第 
二 个 值 是 start+l*step=2 (注意 ， 这 里 是 1， 不 是 2， 不 论 是 列表 还 
是 字符 串 ， 索 引 值 都 是 从 0 开始 的 ) ， 第 n 个 值 就 是 start+ (n-1) 
#Step。 直到 小 于 stop 前 的 那个 值 8 


融 悉 了 上 面 的 计算 过 程 ， 想 一 想 这 个 的 结果 是 什么 。 


>>> range(-9) 


期 望 返回 [0，-1，-2，-3，-4，-5，-6，-7，-8] 能 实现 吗 ? 
分 析 一 下 ， 这 里 start=0，step=1，stop=-9 。 


第 一 个 值 是 0;， 第 二 个 是 start+l*step， 将 上 面 的 数 代 入 应 该 是 1， 但 是 
最 后 是 -9， 显 然 出 现 问 题 了 。 但 是 ，Python 在 这 里 不 报错 ， 它 运 回 的 


>>> range(-9) 
[] 

>>> range(0, -9) 
[] 

>>> range(0) 


[] 


报错 和 返回 结果 是 两 个 
返回 的 不 是 我 们 要 的 。 应 该 如 何 修改 呢 ? 


>>> range(9，-9，-1) 
[9, -1, -2, -3, -4, -5, -6, -7, -8] 
>>> range(0, -9, -2) 


[0, -2, -4, -6, -8] 


有 了 这 个 内 置 画 数 ， 很 多 事情 瑟 简单 了 。 比 如 : 


>>> range(0, 100, 2) 


[©; 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24) 26, 28, 30,; 32, 34, 36, 38, 40, 42, 44, 46, 48, 56,; 52, 54, 56, 58 
,， 60, 62, 64, 66, 68, 70, 72， 74， 76， 78， 80, 82， 84， 86， 88, go, 92， 94， 96， 98] 


的 从 内 的 目 然 数 中 的 偶数 组 成 的 列表 束 非 党 简单 地 搞定 了 上 面 那个 问 
题 9 


思考 一 个 问题 ， 现在 有 一 个 列表 ， 比 如 是 

["I" "am" "gq" "pythoner" ， A "am" ， "Jearning" ， "it" "with" ， 
iwsir"]， 要 得 到 这 个 列表 的 索引 值 组 成 的 列表 ， 但 是 不 能 一 个 一 个 用 
手 尼 夫 及 将 革 么 男 ? 


请 青 沉 思 两 了 分 钟 之 后 ， 目 已 实验 一 下 ， 然后 看 下 面 站 


>>> pythoner 


d 


['I', 'am', 'a', 'pythoner', 'I', 'am', 'learning', "it', ‘'with', 'qiwsir'] 
>>> py_index = range(len(pythoner)) # 以 len(pythoner ) 为 stop 的 值 
>>> py_index 


[9, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


再 用 手指 头 指 着 Pythoner 里 面 的 元 素数 一 数 ， 是 不 是 跟 结 采 一 样 ? 
例 ， 找 出 100 以 内 的 能 够 被 3 整除 的 正 整 数 。 


分 析 : 这 个 问题 有 两 个 限制 条 件 ， 第 一 是 100 以 内 的 正 整数 ， 根 据 前 
面 所 学 ， 可 以 用 range (1，100) 来 实现 ， 第 二 个 是 要 解决 被 3 整除 的 
问题 ， 假 设 某 个 正 整 数 n 能 够 被 3 整除 ， 也 就 是 "2%3 (% 是 取 余 数 ) 为 
0。 那 么 如 何 得 到 n 呢 ， 束 是 要 用 for 循 环 。 


以 上 做 了 人 简单 分 析 ， 要 实现 流程 ， 还 需要 细 化 一 下 。 按 照 前 面 曾经 讲 
授 过 的 一 种 方法 ， 要 男 出 解决 问题 的 流程 图 ， 如 图 2-2 所 示 。 


aliquot = [] 


foriin range(1, 100) 


no 


yes 


aliquot.append(n) 


print aliquot 


图 2-2 解决 问题 的 流程 图 


下 面 写 代码 就 古 “ 按 图 索 双 ”了 。 


#! /usr/bin/env python 


#coding:utf-8 


aliquot = [] 


for n in range(1, 100): 
if n % 3 == 0: 


aliquot.append(n) 


print aliquot 


代码 运行 


[3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 81, 84, 87, 90, 
93，96，99] 


在 上 面 的 代码 中 ， 将 for 循 环 和 if 条 件 判断 都 用 上 了 。 
不 过 ， 感 觉 有 点 儿 有 矿 烦 ， 其 实 这 么 做 整 可 以 了 : 


>>> range(3,100,3) 


[3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 81, 84, 87, 
90, 93, 96, 99] 


2.4.3 ”for 的 对 象 
所 有 的 序列 类 型 对 象 都 能 够 用 for 来 循环 。 比 如 : 


>>> name_str = "qiwsir" 
>>> for i in name_str: 


print i, 
对 计 广 全 坟 这 


>>> name_list = list(name_str) 


>>> name_list 


>>> for i in name_list: 


print 3 
qiwsir 
>>> name_set = set(name_str) #Set 还 可 以 用 
>>> name_set 
set(['q ‘i', 's', 'r', 'w']) 
>>> for i in name_set: 
print i, 


dd 主人 TW 


>>> name_tuple = tuple(name_str) 


>>> name_tuple 
rg, ai ws or) 
>>> for i in name_tuple: #tuple 也 能 呀 


print i, 


qiwsir 


>>> name_dict={"name": "qiwsir", "lang": "python", "website": 
>>> for i in name_dict: #dict 也 不 例外 
print i, "-->", name_dict[i] 


lang --> python 
website --> qiwsir.github.io 


name --> qiwsir 


"qiwsir.github.io"} 


用 for 循 环 读 取 字 典 “ 键 / 值 ?对 需要 多 说 儿 句 。 


有 这 样 一 个 字典 : 


>>> a_dict = {"name": "qiwsir", "lang": "python", "email": 


获得 字典 键 、 值 的 钞 数 有 : 


"qiwsir@gmail.com", "website": "www.itdiffer.com"} 


items/iteritems/keys/iterkeys/values/itervalues， 通 过 这 些 芳 数 得 到 的 是 键 


或 者 值 的 列表 。 


>S% Por Kin AUict(y 


print k, a_dict[k] 


lang python 
website www.itdiffer.com 
name qiwsir 


email qiwsir@gmail.com 


这 是 一 种 获得 字典 键 / 值 对 的 方法 ， 


一 般 需要 


>>> for k,v in a_dict.items(): 


print k, v 


lang python 
website www.itdiffer.com 
name qiwsir 


email qiwsir@gmail.com 


>>> for k,v in a_dict.iteritems(): 


print k, v 


lang python 
website www.itdiffer.com 
name qiwsir 


email qiwsir@gmail.com 


这 两 种 方法 也 能 够 实现 同样 的 效 末 ， 特 别 是 第 二 个 iteritems(O) 效 率 挺 


[© 


ul 


但 是 ， 要 注意 下 面 的 方法 : 


>>> for k in a_dict.keys(): 


print k, a_dict[k] 


lang python 
website www.itdiffer.com 
name qiwsir 


email qiwsir@gmail.com 


这 种 方法 所 达到 的 效果 跟前 面 一 样 ， 但 不 太 提 倡 ， 因 为 效率 比较 低 。 


>>> for v in a_dict.values(): 


print v 


python 
www.itdiffer.com 
qiwsir 


qiwsir@gmail.com 


>>> for v in a dict.itervalues(): 


print v 
python 
www.itdiffer.com 
qiwsir 


qiwsir@gmail.com 


单独 取 values， 推 荐 第 二 种 方法 。 
2.4.4 zip() 


前 面 了 解 了 “可 迭代 的 (iterable) ”这 个 词 ， 这 里 再 次 提 到 “从 代 ”， 说 
明 它 在 Python 中 占有 重要 的 位 置 。 


人 表现 就 是 用 for 循 环 ， 从 序列 对 象 中 获得 一 定数 量 的 
元 素 。 


人 ` 字符 串 、 元 组 ， 旋 至 于 字典 的 键 / 值 对 都 是 迭 


现实 中 迭代 不 是 都 那么 简单 的 ， 比 如 下 面 这 个 问题 。 


问题 : 有 两 个 列表 ， 分 别 是 : a=[1，2，3，4，5]，b=[9，8，7，6， 
5]， 要 计算 这 两 个 列表 中 对 应 元 素 的 和 。 


解析 : 
经 观 罕 发 现 两 个 列表 的 长 度 一 样 ， 都 是 5。 那 么 对 应 元 系 求 和 ， 驶 是 相 


同 的 索引 值 对 应 的 元 素 求 和 ， 即 a[ij+b[i (i=0，1，2，3，4) ， 这 样 
Ee 。 当然 ， 要 用 for 来 做 这 个 事情 


>>> a = [1,2,3,4,5] 

>>> b = [9,8,7,6,5] 

>>> c = [] 

>>> for i in range(len(a)): 


c.append(a[i] + b[i]) 


[10, 10, 10, 10, 10] 
看 来 for 的 表现 还 不 错 。 


这 种 方法 虽然 解决 了 问题 ， 但 Python 总 不 会 局 限于 一 个 解决 之 道 。 于 
征 又 有 一 个 内 建 男 数 zip0， 可 以 让 同样 的 问题 有 不 一 样 的 解决 途径 。 


zip0 是 什么 东西 ? 在 交互 模式 下 用 help (zip) ， 得 到 官方 文档 是 : 
Zip(...)Zip(Seq1[L,seq2[...]])-> [(seq1[0],seq2[0]...),(...)] 


Return a list of tuples,where each tuple contains the i-th element from each 
of the argument sequences.The returned list is truncated in length to the 
length of the shortest argument sequence. 


seql、seq2 分 别 代 表 了 序列 类 型 的 数据 。 通 过 实验 来 理解 上 面 的 文 
档 : 


>>> a = "qiwsir" 
>>> b = "github" 
>>> zip(a,b) 


[9 'g), Ci Ni), (Ww tI), sh iu) (Cr', 'b')] 


如 果 友 列 长 度 不 同 ， 那 么 惑 以 “the length of the shortest argument 
sequence” 为 准 。 


Ep a 
> d= [98,776] 
>>> zip(c,d) 


[(1, 9), (2, 8), (3, 7)] 


>>> m = {"name", "lang"} 
>>> n = {"qiwsir","python"} 
>>> zip(m,n) 


[('lang', 'python'), ('name', 'qiwsir')] 


m、n 是 字典 吗 ? 当然 不 是 ， 下 面 的 才 是 字典 呢 。 


>>> S = {"name":"qiwsir"} 
>>> t = {"lang":"python"} 
>>> zip(s,t) 


[('name', 'lang')] 


zip0 是 一 个 内 荀 函 数 ， 它 的 参数 必须 是 某 种 序列 数据 类 型 ， 如 琳 是 字 
典 ， 那 么 视 为 序列 。 然 后 将 序列 对 应 的 元 素 依 次 组 成 元 组 ， 并 单 做 列 
表 中 的 元 素 。 


下 面 是 比较 特殊 的 情况 ， 当 参数 是 一 个 序列 时 所 生成 的 结果 : 


>>> a 
"qiwsir' 

>>> c 

[1，2，3] 

>>> zip(c) 

[(1,), (2,), (3,)] 
>>> zip(a) 


[qi COw Cs air] 


其 实 也 不 特殊 ， 因 为 只 提供 了 一 个 参数 ， 那 么 列表 中 的 元 组 束 一 个 元 
素 ， 此 时 元 组 中 元 素 后 面 要 有 一 个 逗号 (半角 的 ) 。 


很 好 的 zip0! 那么 束 用 它 来 解决 前 面 列表 中 值 对 应 相 加 问题 吧 。 


>>> d = [] 


>>> for x,y in zip(a,b): 


d.append(x + y) 


>>> d 


[10, 10, 10, 10, 10] 


比较 这 个 问题 的 两 种 解法 ， 似 乎 第 一 种 解法 适用 面 较 窗 ， 比 如 ， 如 果 
已 知 给 定 的 两 个 列表 长 度 不 同 ， 那 么 第 一 种 解法 就 出 问题 了 ， 而 第 二 
种 解法 还 可 以 继续 适用 。 的 确 如 此 ， 不 过 ， 第 一 种 解法 也 不 是 不 能 个 
订 的 。 


>>> a = [1,2,3,4,5] 


>>> b = ["python", "www.itdiffer.com","qiwsir"] 


如 果 已 知 是 这 样 两 个 列表 ， 要 将 对 应 的 元 素 “ 加 起 来 * 。 


>>> length = len(a) if len(a)<len(b) else len(b) 
>>> length 


首先 用 这 种 方法 获得 两 个 列表 中 最 短 的 那个 列表 的 长 度 。 写 出 这 人 句 ， 
吕 可 以 冒充 高 手 了 。 


c.append(str(a[i]) + ":" + b[i]) 


['1i:python', '2:www.itdiffer.com', '3:qiwsir'] 


我 还 是 用 第 一 个 思路 做 的 ， 经 过 这 么 修正 一 下 ， 也 还 能 用 。 要 注意 一 
个 细 市 ， 在 “加 ”的 时 候 ， 不 能 直接 用 a[i] ， 因 为 它 引 用 的 对 象 是 一 个 int 
类 型 ， 不 能 跟 后 面 的 str 类 型 相 加 ， 必 须 转化 一 下 。 

当然 ，zip0 也 是 能 解决 这 个 问题 的 。 


>>> d = [] 


So Tor Xo -Ln Zip(R ,Bb): 


d.append(x + y) 


Traceback (most recent call last): 
File "<stdin>", line 2, in <module> 


TypeError: unsupported operand type(s) for +: 'int' and 'str' 


报销 ! 看 销 府 信 息 ， 我 刚刚 提醒 的 那个 问题 束 冒 出 来 了 。 所 以 ， 应 该 


这 么 做 : 


>>> for x,y in zip(a,b): 


d.append(str(x) + ":" + y) 


>>> d 


[ 1:python'"， '2:www.itdiffer.com', '3:qiwsir'] 


这 才 得 到 了 正确 结果 。 


切记 : Computer 是 一 个 姑 女 ， 她 非常 秀 
心地 、 细 心地 跟 她 相处 。 


以 上 两 种 写法 哪个 更 好 呢 ? 


DT 人 St 
[(2, 11), (4, 13), (6, 15), (8, 17)] 
>>> zip(*result) 


[(2, 4, 6, 8), (11, 13, 15, 17)] 


zip0 还 能 这 么 干 ， 是 不 是 有 点 意思 ? 
下 面 延 伸 一 个 问题 。 


问题 : 有 一 个 字典 tyinfor= 
{"name":"giwsir", "site":" 


变换 成 : infor= 


Tol 


{"giwsir":"name", "giwsir.github.io 


解析 : 


giwsir.github.io", 


:"Site", 


ToT 


"lang":"python"}, 


"python":"lang"} ° 


气 ， 需 要 痪 代码 的 小 伙 子 们 耐 


这 个 字典 


St 


解法 有 几 个 ， 如 采用 for 循 环 ， 可 以 这 样 做 (当然 ， 方 法 不 限于 下 列 几 


To 


>>> infor = {} 


>>> for k, v in myinfor .items() : 


infor[v]=k 


>>> infor 


{'python': 'lang', 'qiwsir.github.io': 'site', 'gqiwsir': 'name'} 


下 面 用 zip0) 来 试 试 : 


>>> dict(zip(myinfor.values(), myinfor.keys())) 


{'python': 'lang', 'qiwsir.github.io': 'site', 'gqiwsir': 'name'} 


这 是 什么 情况 ?原来 这 个 zip0 还 能 这 样 用 。 是 的 ， 本 质 上 是 这 么 回 
事 。 如 果 将 上 面 这 一 行 分 解 开 来 ， 就 明白 其 中 的 奥妙 了 。 


>>> myinfor .values() 


['python', 'qiwsir', 'qiwsir.github.io'] 

>>> myinfor.keys() 

['lang', 'name', 'site'] 

>>> temp = zip(myinfor.values(),myinfor.keys()) 
>>> temp 


[('python', 'lang'), ('qiwsir', 'name'), ('qiwsir.github.io', 'site')] 


>>> dict(temp) 


{'python': 'lang', 'qiwsir.github.io': 'site', 'gqiwsir': 'name'} 


9 征 不 是 明日 zip0 和 循环 的 关系 了 呢 ? 有 了 它 可 以 让 某 些 循环 简 


2.4.5 enumerate() 
本 来 可 以 通过 fori in range (len (list) ) 的 方式 得 到 一 个 list 的 每 个 元 


素 索 引 ， 然 后 再 用 list 中 的 方式 得 到 该 元 素 。 如 果 要 同时 得 到 元 聚 索引 
和 元 素 怎 么 办 ? 可 以 这 样 : 


>>> for i in range(len(week)): 


print week[i]+' is '+str(i) 
monday is 0 


Sunday is 1 


friday is 2 


注意 ，i 是 int 类 型 ， 如 有 果 和 前 面 的 用 + 连接 ， 必 须 十 str 类 型 。 


Python 中 提供 了 一 个 内 置 画 数 enumerate， 能 够 实现 类 似 的 功能 。 


>>> for (iday) in enumerate(week): 


print day+' is '+str(i) 


monday is 0 
Sunday is 1 


friday is 2 


官方 文档 是 这 么 说 的 : 


Return an enumerate object.sequence must be a sequence, an iterator, or 
some other object which supports iteration.The next()method of the iterator 
returned by enumerate()returns a tuple containing a count (from start 

which defaults to 0) and the values obtained from iterating over sequence: 


顺便 抄录 几 个 例子 ， 供 读者 欣赏 ， 但 最 好 目 己 实验 一 下 。 


>>> seasons = ['Spring', 'Summer', 'Fall', 'Winter'] 


>>> list(enumerate(seasons)) 
[(9， 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'wWinter')] 
>>> list(enumerate(seasons, start=1)) 


LE(L: "Spring' yy (27 "Summer™ )2 (3 "FAL Ys- {4 "Winter”)] 


对 于 这 样 一 个 列表 : 


>>> mylist = ["qiwsir",703,"python"] 
>>> enumerate(mylist) 


<enumerate object at QOxb74a63c4> 


出 现 这 个 结果 ， 用 list 殉 能 实现 转换 ， 显 示 内 容 意 味 着 可 迭代 。 


>>> list(enumerate(mylist)) 


[(9， 'qiwsir'), (1, 703), (2, 'python ' )] 
再 设计 一 个 小 问题 ， 练 习 一 下 这 个 函数 。 


问题 : 将 字符 果 中 的 某 些 字符 奉 换 为 其 他 的 字符 串 。 原 始 字符 哩 
为 "Do you love Canglaoshi?Canglaoshi is a good teacher"， 请 


将 "Canglaoshi" 符 换 为 "PHP" 。 
解析 : 


>>> raw = "Do you love Canglaoshi? Canglaoshi is a good teacher." 


不 能 直接 对 这 个 字符 串 使 用 enumerate()， 因 为 它 会 变 成 这 样 : 


>>> list(enumerate(raw)) 


[(9, 'D'), (1, 'o'), (2, " '), (3, 'y'), (4, 'o'), (5, 'u'), (6, ' '), (7, '1'), (8, '0'), (9, 'v'), (10, 'e'), (1 

1, " ), (12, 'C'), (13, 'a'), (14, 'n'), (15, 'g'), (16, '1'), (17, 'a'), (18, 'o'), (19, 's'), (29, 'h'), (21, 'i'), 

(22, '?'), (23, " '), (24, 'C'), (25, 'a'), (26, 'n'), (2 g'), (28, '1'), (29, 'a'), (30, '0'), (31, 's'), (32, 'h 

), (33, "i'), (34, ' '), (35, 'i'), (36, 's'), (37, ), ( Qs (39 庆 ”Jr (40, 9 1 (41i 29 7 (42; 9 47 (43 
d'), (44, 1 1), (45, 't'), (46, 'e'), (47, "a'), (48, 'c'), (49, 'h'), (50, 'e'), (51, 'r'), (52, ".')] 


这 不 是 所 需要 的 ， 所 以 ， 先 把 raw 转 化 为 列表 : 


>>> raw_ lst = raw.split(" ") 


然后 用 enumerate(): 


>>> for i, string in enumerate(raw_ lst): 
if string == "Canglaoshi": 


raw_lst[i] = "PHP" 


没有 什么 异常 现象 ， 查 看 一 下 那个 raw_lst 列 表 ， 看 看 是 不 是 
把 "Canglaoshi" 蔡 换 为 "PHP" 了 。 


>>> raw_lst 


['Do', 'you', 'love', 'Canglaoshi?', 'PHP', 'is', 'a', 'good', 'teacher.'] 


只 替换 了 一 个 ， 还 有 一 个 没有 替换 ， 为 什么 ? 仔细 观 穴 发 现 ， 没 有 替 
跟 条 件 判断 中 的 "Canglaoshi" 不 一 样 。 


修改 一 下 ， 把 条 件 放宽 : 


>>> for i, string in enumerate(raw_ lst): 
if "Canglaoshi" in string: 


raw_lst[i] = "PHP" 


>>> raw_lst 


['Do', 'you', 'love', 'PHP', 'PHP', 'is', 'a', 'good', 'teacher.'] 


然后 再 转化 为 字符 串 ， 留 给 读者 试 试 。 
2.4.6 ”列表 解析 


先 看 下 面 的 例子 ， 想 得 到 1 到 9 每 个 整数 的 平方 ， 并 且 将 结 采 放 在 列表 
a A 


>>> power2 = [] 
>>> for i in range(1, 10): 


power2.append(i*i) 


>>> power2 


[1, 4, 9, 16, 25, 36, 49, 64, 81] 


Python 有 一 个 非常 有 意思 的 功能 ， 束 和 list 解析 ， 征 这 样 的 : 


>>> Squares = [x**2 for x in range(1,10)] 
>>> squares 


Li; 4 9; -16, 25, 38, 49; 64; 2821] 
看 到 这 个 结果 还 不 惊叹 吗 ? 这 丈 是 Python， 妃 求 简 洛 优 雅 的 Python ! 


其 官方 文档 中 有 这 样 一 段 描 述 ， 道 出 了 list 解 析 的 真 详 : 


List comprehensions provide a concise way to create lists.Common 
applications are to make new lists where each element is the result of some 
operations applied to each member of another sequence or iterable，or to 
create a subsequence of those elements that satisfy a certain condition. 


这 就 古 Python 有 意思 的 地 方 ， 也 古 计 算 机 高 级 语言 编程 有 意思 的 地 
方 ， 你 只 要 动脑 筋 ， 避 3 能 找到 惊喜 。 


和 


>>> mybag = [' glass',' apple','green leaf ']  # 有 的 前 面 有 空格 ， 有 的 后 面 有 空格 
>>> [one.strip() for one in mybag] # 去 掉 元 素 前 后 的 空格 


['glass', 'apple', 'green leaf'] 


list 解 析 的 执行 效率 高 ， 代 码 简洁 明了 ， 在 实际 写 程序 中 经 常会 用 到 。 
2.5 while 循环 


while， 翻 译 成 中 文 是 “ 当 ..….. 的 时 候 ”， 这 个 单词 在 英语 中 常常 用 来 作 
为 时 间 状 语 ，while...someone do somthing， 这 种 类 型 的 说 法 是 有 的 。 


在 Python 中 ， 它 也 有 这 个 舍 义 ， 区 别 是 “ 当 .……. 时 候 ” 这 个 条 件 成 立 在 
一 段 范 围 或 者 时 间 间 隅 内 ， 从 而 在 这 段 时 间 间 隔 内 让 Python 做 好 多 事 
情 。 束 好 比 这 样 一 段 情 景 : 


while 年 龄 大 于 69 岁 : # 当 年 龄 大 
退休 


69 岁 的 时 候 


# 凡 是 符合 上 述 条 件 就 执行 的 动作 


展开 想象 ， 如 果 制 作 一 道门 ， 这 道门 是 用 上 述 的 条 件 调控 开关 ， 假 设 
有 很 多 人 经 过 这 个 门 ， 只 惨 年 龄 大 于 60 岁 束 退 休 〈 门 打开 ， 人 可 以 出 
去 ) ， 一 个 接 一 个 地 这 样 循环 下 去 ， 突 然 有 一 个 人 年 龄 是 50 岁 ， 那 么 
这 个 循环 在 这 里 就 停止 ， 即 不 满足 条 件 了 。 


这 束 是 while 循 环 。 写 一 个 闻 肃 点 儿 的 流程 ， 如 图 2-3 所 示 。 


statements false 


图 2-3 while 循环 


2.5.1 “ 猜 数 字 游 戏 


前 不 入， 有 一 个 在 校 的 大 学 生 朋 友 〈 李 航 ) 给 我 发 邮件 ， 让 我 看 了 他 
做 的 游戏 ， 这 球 游 戏 能 够 实现 多 次 猜 数 ， 直 到 猜 中 为 止 。 这 是 一 个 多 
么 言 欢 学 习 的 大 学 生 呀 。 


现在 将 他 写 的 程序 茶 录 于 此 ， 这 一 举动 已 经 得 到 了 李 航 同学 在 QQ 上 的 
授权 ， 感 谢 他 对 本 书 的 支持 。 


#! /usr/bin/env python 


#coding:UTF-8 


import random 


i=0 
while i 4 
站 从 兴 容光 奖 实业 
num = input(' 请 您 输入 9 到 9 任 一 个 数 :，' ) # 李 同学 用 的 是 Python3 


xnum = random.randint(0, 9) 


x=3-i 


if num 
print' 运 气 真 好 ， 您 猜 对 了 ! ，' 
break 
elif num > xnum 
print''' 您 猿 大 了 !\n 哈 哈 , 正确 管 案 是 :%s\n 您 还 有 %s 次 机 会 ! ''' %(xnum, x) 


elif num < xnum 


print''' 您 猿 小 了 !\n 哈 哈 , 正确 管 案 是 :%s\n 您 还 有 %s 次 机 会 ! ''' %(xnum, x) 


十 申 兴 光 灾 容光 次 内 内 风灾 内 次 风 内容 风灾 内 内 风灾 突 肉 风 容 突 央 风灾 内燃 灾 上 
print 


我 们 来 分 析 一 下 。 


首先 看 while i<4， 这 是 程序 中 为 猜测 限制 的 次 数 ， 最 多 是 三 次 ， 请 注 
意 ， 在 while 循 环 体 中 的 最 后 一 句 : it=1， 这 是 说 每 次 循环 到 最 后 就 给 i 
增加 1， 当 bool \I<4) 为 False 的 时 候 ， 就 不 再 循环 了 。 


当 bool (i<4) 为 True 的 时 候 ， 就 执行 循环 体内 的 语句 。 在 循环 体内 ， 
让 用 户 输 入 一 个 整数 ， 然 后 程序 随机 选择 一 个 整数 ， 最 后 判断 随机 生 
0 

716 


， 日 了 上 述 代码 ， 殊 可 以 进一步 研究 是 否 可 以 优化 或 者 进行 其 他 修 
Mo 


为 了 让 用 户 的 体验 更 奏 ， 不 妨 把 输入 的 整数 范围 扩大 至 1 到 100 之 间 。 
我 用 的 是 python 2.7， 在 输入 指令 上 区 别 于 李 同 学 。 


程序 用 num_input 变 量 接收 了 输入 的 内 容 。 读 者 如 采 要 在 这 里 睡觉 ， 请 
打 起 精神 ， 我 要 分 至 一 个 多 年 的 编程 经 答 。 


请 牢记 : 任何 用 户 输入 的 内 容 都 是 不 可 靠 的 。 

这 人 句 话 售 义 深刻 ， 但 是 ， 这 里 不 做 过 多 的 解释 ， 需 要 各 位 在 随后 的 编 
程 生 涯 中 体验 。 根 据 此 经 验 ， 我 们 要 检验 用 户 输入 的 是 否 符 合 我 们 的 
要 求 ， 我 们 要 求 用 户 输入 1 到 100 之 间 的 整数 ， 那 么 要 做 如 下 检验 : 


。 输 入 的 是 否 是 整数 。 


。 如果 是 整数 ， 是 否 在 1 到 100 之 间 。 
为 此 ， 要 做 : 


if not num_input.isdigit(): #str.isdigit() 是 用 来 判断 字符 串 是 否 纯粹 由 数字 组 成 


print "Please input interger." 
elif int(num_input)<0 and int(num_input)>=100: 
print "The number should be in 1 to 100." 
else: 


pass 


这 里 用 pass 的 意思 古 暂 时 省 略 ， 如 末 满 足 了 前 面 提出 的 要 求 ， 束 该 执 
行 此 处 语句 。 


再 看 看 李 航 同学 的 程序 ， 在 循环 体内 产生 一 个 随机 的 数字 ， 这 样 用 户 
每 次 输入 ， 面 对 的 都 是 一 个 痢 的 随机 数字 ， 这 使 得 猜 数 字 游 戏 难度 太 
大 了 。 我 希望 程序 产生 一 个 数字 ， 直 到 猜 中 都 是 这 个 数字 。 所 以 ， 要 
把 产生 随机 数字 这 个 指令 移动 到 循环 之 前 。 


import random 


number = random.randint(1,100) 


while True: # 不 限制 用 户 的 次 数 了 


观察 李 同 学 的 程序 ， 还 有 一 点 需要 说 明 ， 那 就 是 在 条 件 表 达 式 中 ， 两 
边 最 好 是 同 种 类 型 数据 ， 上 面 的 程序 中 有 num>xnum 样 式 的 条 件 表达 
式 ， 一 边 生 程序 生成 的 int 类 型 数据 ， 而 另 一 边 征 通过 输入 函数 得 到 的 
str 类 型 数据 。 在 茶 些 情况 下 可 以 运行 ， 为 什么 ? 都 是 数字 的 时 候 是 可 
以 的 ， 但 是 这 样 不 好 。 


那么 ， 按 照 这 种 思路 ， 把 这 个 猜 数 字 程 序 重 写 一 下 : 


#coding:utf-8 

import random 

number = random.randint(1,101) 
guess = 0 


while True : 


num_input = raw_input("please input one integer that is in 1 to 100 
guess += 1 


if not num_input.isdigit(): 
print "Please input interger." 
elif int(num_input) < © or int(num_input) >= 100: 


print "The number should be in 1 to 100." 
else: 


if number == int(num_input): 


print "OK, you are good.It is only %d, then you successed." % guess 
break 


elif number > int(num_input): 
print "your number is more less." 
elif number < int(num_input): 


print "your number is bigger." 


else: 


print "There is something bad, I will not work" 
以 上 仅 供 参考 ， 读 者 还 可 改进 。 


2.5.2 ”break 和 continue 


break 的 含义 号 是 要 在 这 个 地 方 中 断 循环 ， 跳 出 循环 体 。 下 面 这 个 简要 
的 例子 更 明显 : 


#!/usr/bin/env python 


#coding:utf-8 


print "%d is odd number"%a 
a=0 


a=8 的 时 候 ， 执 行 循环 体 中 的 break 跳 出 循环 ， 执 行 最 后 的 打印 语句 ， 
得 到 结果 : 


如 果 a=9， 则 要 执行 else 里 面 的 print， 然 后 a=0， 循 环 就 再 执行 一 次 ， 又 
break 了 ， 得 到 结果 : 


而 continue 则 是 要 从 当前 位 置 ( 即 continue 所 在 的 位 置 ) 跳 到 循环 体 的 
最 后 一 行 的 后 面 (不 执行 最 后 一 行 ， 对 一 个 循环 体 来 讲 ， 就 如 同 首 
尾 衔 接 一 样 ， 最 后 一 行 的 后 面 是 哪里 呢 ? 当然 是 开始 了 。 


#!/usr/bin/env python 


#coding:utf-8 


0 # 如 果 是 偶数 ， 就 返回 循环 的 开始 


print "%d is odd number"%a  # 如 果 是 奇数 ， 就 打印 出 来 


其 实 ， 对 于 这 两 个 条 件 ， 我 个 人 在 编程 中 很 少 用 到 ， 因 为 我 有 一 个 固 
执 的 观念 ， 尽 量 将 条 件 在 循环 之 前 做 足 ， 不 要 在 循环 中 跳 来 跳 去 ， 


为 这 样 不 仅 可 读 性 下 降 了 ， 有 时 候 目 己 也 容易 糊涂 。 
2.5.3 while...else 


while...else 有 点 类 似 于 if...else， 只 需要 一 个 例子 就 理解 了 ， 当 然 ,， 一 过 
人 else， 就 意味 着 已 经 不 在 while 循 环 内 了 。 


#!/usr/bin/env python 


count = 0 

while count < 5: 
print count, " is less than 5" 
count = count + 1 

else: 


print count, " is not less than 5" 


执行 结果 : 


9 is less than 5 
1 is less than 5 
2 18 less than 5 
S18 less than 5 
4 is less than 5 


5 is not less than 5 


2.5.4 for...else 


除了 有 while...else 外 ， 还 可 以 有 for..else， 这 个 循环 也 通常 用 于 跳出 循 
环 之 后 要 做 的 事情 。 


#!/usr/bin/env python 


# coding=utf-8 
from math import sqrt 


for n in range(99, 1, -1): 
root = sqrt(n) 
if root == int(root): 
print n 
break 
else: 


print "Nothing." 


读者 是 否 能 够 读 懂 这 段 代 码 的 舍 义 ? 


阅读 代码 是 一 个 提升 目 己 编程 水 平 的 好 方法 。 如 何 阅读 代码 ? 像 看 网 
开 新 闻 那 样 史 一 目 只 看 目 己 喜欢 的 文字 ， 甚 至 标题 看 不 完整 开始 
喷 。 


绝对 不 是 这 样 ， 阅 读 代 码 的 最 好 方法 是 给 代码 做 注释 。 对 ， 如 有 果 有 可 
能 束 给 每 行 代码 做 注释 ， 这 样 束 能 理解 代码 的 含义 了 。 


对 于 上 面 的 代码 ， 读 者 不 妨 做 注释 ， 看 看 它 到 底 在 干什么 。 把 for n in 
range (99，1，-1) 修改 为 forn in range (99，81，-1) 看 看 是 什么 结 
果 o 


2.6 文件 


文件 是 Computer 姑 女 非 常 重要 的 东西 ， 在 Python 里 ， 它 也 是 一 种 类 型 

的 对 象 ， 类 似 前 面 已 经 学 习 过 的 其 他 类 型 ， 包 括 文本 的 、 图 片 的 、 首 

频 的 、 视 频 的 等 ， 还 有 不 少 没 见 过 的 扩展 名 的 。 事 实 上 ， 在 Linux 操 作 
系统 中 ， 所 有 的 东西 都 被 保存 到 文件 中 。 


先 在 交互 模式 下 得 看 文件 都 有 哪些 属性 和 函数 : 


>>> dir(file) 


['_class__', '_delattr_ _  '，' doc ', '_ enter_', '_ exit ', '_ format ', '_ getattribute  '，' 
init__', '_ iter_', '_ new ', '_reduce ', '_reduce ex _', '_repr_', etattr_ ', '_ size 
subclasshook ', 'close', 'closed', 'encoding', 'errors', 'fileno', 'flush', 'isatty', 'mode', 'name', 'newlines', 'ne 
xt', 'read', 'readinto', 'readline', 'readlines', 'seek', 'softspace', 'tell', 'truncate', 'write', 'writelines', 'xre 
adlines'] 


hash 
str 


I 
1 1 


这 里 只 对 部 分 属性 或 函数 进行 详细 说 明 ， 读 者 可 以 用 本 书 一 贯 倡导 的 
方法 目 学 。 在 网 上 看 到 过 一 个 统计 ， 绝 大 多 数 程序 员 都 是 目 学 成 才 
问 周围 的 大 牛 程序 员 ， 目 学 在 他 们 的 职业 生涯 中 占据 什 
人 笃 地 位 。 


等 别 注 意 观 察 ， 在 上 面 有 _iter 这 个 东西 。 在 讲述 列表 的 时 候 它 是 不 
是 也 曾经 出 现 了 呢 ? 如 果 没有 注意 看 ， 请 目 己 在 交互 模式 中 找 出 来 。 
_jiter _ 古 一 个 重要 的 标志 ， 它 意味 着 这 种 类 型 的 数据 是 可 迄 代 的 。 接 
下 来 ， 你 束 会 看 到 ， 可 达 代 的 十 多 么 神 否 。 


2.6.1 打开 文件 


在 某 个 文件 夹 下 面 建立 了 一 个 文件 ， 名 为 : 130.txt， 并 且 在 里 面 输入 
了 如 下 内 容 : 


learn python 
http://qiwsir.github.io 


qiwsir@gmail.com 


[1 
下 图 显示 了 这 个 文件 的 存储 位 置 : 


qwGqw-Latitude-E4300:~/Documents/ITArtimas 人 BasicPython/codes5 ls 
| 

165-1.py 106-1.py 111-1.py 129-1.pPyY \136 .txt 

165.py 109 .py 118-1.py 129-2.py \S 


qwGqw-Latitude-E4300:~/Documents/ITArticLes/BasicPython/codes9 python| 
我 在 当前 位 置 输入 了 python (我 已 经 设置 了 环境 变量 ， 如 果 你 没有 设 


置 ， 需 要 写 全 局 动 Python 命令 路 径 ) ， 进 入 到 交互 模式 。 在 交互 模式 
下 ， 这 样 操作 : 


>>> f = open("130.txt") # 打 开 已 经 存在 的 文件 


>>> for line in f: 


print line 


learn python 


http://qiwsir.github.io 


qiwsir@gmail.com 


将 打开 的 文件 赋值 给 变量 f， 这 样 束 旦 变量 f{ 跟 对 象 文件 130.txt 用 线 连 起 
和 


接 下 来 ， 用 for 来 读 取 文件 中 的 内 容 ， 束 如 同 读 取 一 个 前 面 已 经 学 过 的 
序列 对 象 一 样 ， 如 列表 、 字 符 串 、 元 组 ， 将 读 到 的 文件 中 的 每 一 行 赋 
值 给 变量 line。 也 可 以 理解 为 ，for 循 环 是 一 行 一 行 地 读 取 文件 内 容 。 
每 次 扫描 一 行 ， 遇 到 行 结束 符号 m 表 示 本 行 结束 ， 然 后 是 下 一 行 。 


从 打印 的 结果 可 以 看 出 ， 打 印 的 每 一 行内 容 跟 文件 中 每 一 行 的 内 容 是 
一 样 的 ， 只 是 行 与 行 之 间 多 了 个 空 行 ， 前 面 显 示 文 章 内 容 的 时 候 ， 并 
没有 这 个 空 行 。 或 许 这 无 关 紧要 ， 但 是 ， 还 要 深究 一 下 才能 名 然 。 


在 原文 中 ， 每 行 结束 都 有 结束 符号 \n， 表示 换行 。 在 for 语 句 汇总 ， 
print line 表 示 每 次 打印 完 line 的 对 象 之 后 区 换行 ， 也 束 是 打印 完 line 的 


对 象 之 后 会 增加 一 个 nm。 这样 看 来 ， 在 每 行 末 尾 束 有 了 两 个 \n， 


ww， 于 是 在 打印 中 就 出 现 了 一 个 空 行 。 


>>> f = open('130.txt') 
>>> for line in f: 
print line, # 后 面 加 一 个 逗号 ， 就 去 掉 了 原来 默认 增加 的 \n 了 


learn python 


在 进行 上 述 操作 的 时 候 ， 有 没有 遇 到 这 样 的 情况 呢 ? 


>>> f = open('130.txt') 


>>> for line in f: 


learn python 


>>> for line2 in f: # 在 前 面 通过 for 循 环 读 取 了 文件 内 容 之 后 ， 再 次 读 取 
print line2 # 然 后 打印 ， 却 没有 显示 任何 结果 


如 果 读 者 没有 巡 到 上 面 的 问题 ， 可 以 试 试 。 


这 不 是 什么 错误 ， 是 因为 前 一 次 已 经 读 取 了 文件 内 容 ， 并 且 到 了 文件 
的 末尾 了 。 再 重复 操作 ， 了 就 是 从 末尾 开始 继续 读 了 。 当 然 显 示 不 了 什 


么 东西 ， 但 是 Python 并 不 认为 这 是 错误 ， 因 为 或 许 在 这 次 读 取 之 前 ， 
已 经 又 向 文件 中 追加 内 容 了 。 那 么 ， 如 果 要 再 次 读 取 人 怎么 办 ? 就 重新 


来 一 过 好 了 。 这 束 好 比 有 一 个 指针 在 指 着 文件 中 的 每 一 行 ， 每 读 完 一 
行 ， 指 针 束 移动 一 行 。 直 到 指针 指向 了 文件 的 最 末尾 。 当 然 ， 也 有 办 


法 把 指针 移动 到 任何 位 置 。 


提醒 读者 注意 ， 因 为 当前 的 交互 模式 是 在 该 文件 所 在 目 孙 局 动 的 ， 所 
以 ， 就 相当 于 这 个 实验 室 和 文件 130.txt 是 同一 个 目录 ， 这 时 候 我 们 打 
开 文件 130.txt， 束 认为 是 在 本 目录 中 打开 ， 如 果 文 件 不 是 在 本 目录 


中 ， 需 要 写 清楚 路 人 径 。 


比如 : 在 上 一 级 日 录 中 (~/Documents/ITArticles/BasicPython) ， 假 如 
进入 到 那个 目录 ， 运 行 交 互 模式 ， 然 后 试图 打开 130.txt 文 件 。 


/Documents/ITArticles/BasicPpython/codes$ ls 
11-1.py 129-1.py 136.txt 
18-1.pyY 129-2.py 


/Documents/ITArticles/BasicPython/codes$ cd .. 
/Documents/ITArticles/RBasicPython$ pytho 


>>> f = open("130.txt") 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
IOError: [Errno 2] No such file or directory: '130.txt' 
>>> f = open("./codes/130.txt") # 必 须 得 写 上 路 径 了 
>>> for line in f: 
print line 
learn python 
http://qiwsir.github.io 
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>>> 


2.6.2 ”创建 文件 


We 打开 的 是 一 个 已 经 存在 的 文件 。 如 何 创建 一 个 新 文件 
听 “ 


>>> nf = open("131.txt", "w") 


>>> nf .write("This is a file") 


这 样本 创建 了 一 个 文件 吗 ? 还 写 入 了 文件 内 容 吗 ? 


qw@qw-Latitude-E43060:~/Documents/ITArticles/Basicpython/codes$ LS 
Os A 1606-1.pyY 11i1-1.pPyY 129-1.py A30.-txt, 
105.py a 109.py 118-1.py 129-2.py (131. txt/ 


qw@qw- Latitude- E43090: ~/Documents/ITArtictes7]Basicpython/codess,. cat 131,txt 


This is” 二 fileqw@qw- [Latitude-E4306: 27DOcURWENtS7TTTAFttCtES7B3SiLCPyENon/codes5 


从 上 图 中 可 以 看 到 ， 真 的 吏 创 建 了 痢 文 件 ， 并 且 里 面 有 “This is a 
file" 那 句 话 。 


注意 ， 这 次 同样 是 用 open0 这 个 函数 ， 但 是 多 了 个 “w”， 这 是 在 告诉 
Python 用 什么 样 的 模式 打开 文件 。 也 就 是 说 ， 用 open0 打 开 文 件 ， 可 以 
有 不 同 的 打开 模式 。 如 表 2-1 所 示 。 


表 2-1 打开 模式 


描 述 


涉 读 方式 打开 文件 ， 可 读 取 文 件 信息 

以 写 方式 打开 文件 ， 可 向 文件 写 入 信息 。 如 文件 存在 ， 则 清空 该 文件 ， 再 写 入 新 内 容 

以 追加 模式 打开 文件 〈 打 开 文 件 ， 文 件 指针 自动 移 到 文件 末尾 )， 如 果 文 件 不 存在 则 创建 

以 读 写 方式 打开 文件 ， 可 对 文件 进行 读 和 写 操作 

消除 文件 内 容 ， 然 后 以 读 写 方式 打开 文件 

以 读 写 方式 打开 文件 ， 并 把 文件 指针 移 到 文件 尾 

六 二进制 模式 打开 文件 ， 而 不 是 以 文本 模式 。 该 模式 只 对 Windows 或 DOS 有效， 类 UNIX 的 文件 是 用 二 进 
制 模式 进行 操作 的 


以 二 进 制 模式 打开 文件 ， 而 不 是 以 文本 模式 。 该 模式 只 对 Windows 或 
DOS 有 效 ， 类 UNIX 的 文件 是 用 二 进 制 模 式 进行 操作 的 


从 表 2-1 中 不 难看 出 ， 在 不 同 模式 下 打开 文件 ， 可 以 进行 相关 的 读 写 。 
那么 ， 如 采 什 么 模式 都 不 写 ， 像 前 面 那 样 呢 ? 那样 吏 黑 认为 是 r 模 式 ， 
以 只 读 的 方式 打开 文件 。 


>>> f = open("130.txt") 


Sm 人 

<open file '130.txt', mode 'r' at 0xb7530230> 
>>> f = open("130.txt","r") 

> 


<open file '130.txt', mode 'r' at 90xb750a700> 


可 以 用 这 种 方式 查看 当前 打开 的 文件 是 采用 什么 模式 打开 的 ， 上 面 显 
示 两 种 模式 是 一 样 的 效果 ， 如 有 条 不 写 那 个 "r"， 束 默认 为 是 只 读 模式 
了 。 下 面 逐个 对 两 个 第 用 模式 进行 解释 。 


1."w": 以 写 方式 打开 文件 ， 可 疝 文 件 写 入 信息 。 如 文件 存在 ， 则 清空 
该 文件 ， 再 写 入 痢 内 容 


131.txt 这 个 文件 是 已 经 存在 的 ， 并 且 在 里 面 有 了 一 句 话 : This is a 
file ° 


>>> fp = open("131.txt") 
>>> for line in fp: 


print line 


This is a file 
>>> fp = open("131.txt","w") 
>>> fp.write("My name is qiwsir.\nMy website is qiwsir.github.io") 


>>> fp.close() 


查看 文件 内 容 (cat 是 Linux 下 显示 文件 内 容 的 命令 ， 这 里 就 是 要 显示 
131.txt 内 容 ) : 


市 :Ca 131:txt 
My name is qiwsir 


My website is qiwsir.github .io 


2."a": 以 追加 模式 打开 文件 〈 即 一 打开 文件 ， 文 件 指针 目 动 移 到 文件 
末尾 ) ， 如 果 文 件 不 存在 则 创建 。 


>>> fp = open("131.txt","a") 


二 
3 


>>> fp.write("\nAha,I like program\n") # 向 文件 中 追 


>>> fp.close() 


在 上 面 两 个 写 入 的 操作 之 后 ， 都 用 close0 来 关闭 文件 ， 这 是 很 重要 的 
一 步 ， 一 定 要 养 成 一 个 习惯 ， 写 完 内 容 之 后 就 关闭 。 


同样 ， 碍 看 文件 内 容 : 


$ cat 131.txt 


My name is qiwsir 
My website is qiwsir.github.io 


其 他 项 目 束 不 一 一 讲述 了 ， 读 者 可 以 目 己 实验 。 

2.6.3 ”使 用 with 

在 对 文件 进行 写 入 操作 之 后 ， 一 定 要 牢记 一 件 事 情 : file.close()， 这 个 
ee 
有 另外 一 种 方法 能 够 不 用 这 么 让 人 揪心 ， 实 现 安 全 地 关闭 文件 。 


>>> with open("130.txt","a") as f: 


f.write("\nThis is about 'with...as...'") 


>>> with open("130.txt","r") as f: 


print f.read() 


learn python 
http://qiwsir.github.io 
qiwsir@gmail.com 


hello 


This is about 'with...as...’' 


J 


里 就 不 用 close0 了， 而 且 这 种 方法 更 有 Python 味道 ， 或 者 说 更 符合 
Pythonic 的 一 个 要 求 。 


2.6.4 文件 的 状态 


有 时 候 需 要 知道 一 个 文件 的 有 关 状 态 〈 也 称 为 属性 ) ， 比 如 创建 日 
期 、 访 问 日 期 、 修 改 日 期 、 大 小 等 。 在 os 模块 中 ， 有 这 样 一 个 方法 ， 
专门 让 我 们 查看 文件 的 这 些 状态 参数 。 


>>> import os 
>>> file_stat = os.stat("131.txt")  ”# 查 看 这 个 文件 的 状态 
>>> file_stat 


posix.stat_result(st_mode=33204, st_ino=5772566L, st_dev=2049L, st_nlink=1, st_uid=1000, st_gid=1000, st_size=69L 
st_atime=1407897031, st_mtime=1407734600, st_ctime=1407734600) 


>>> file_stat.st_ctime # 这 是 文件 创建 时 间 


1407734600 .0882277 


这 是 什么 时 间 ? 看 不 懂 ! 别 着 急 ， 换 一 种 方式 。 在 Python 中 ， 有 一 个 
模块 tme， 是 专门 针对 时 间 设 计 的 。 


>>> import time 
>>> time.localtime(file stat.st_ctime) 


time.struct_time(tm year=2014, tm_mon=8, tm_mday=11, tm_hour=13, tm_min=23, tm_sec=20, tm _wday=0, tm_yday=223, tm_ 
isdst=0) 


2.6.5 read/readline/readlines 


简单 的 读 取 文件 内 容 已 经 了 解 过 了 ， 但是， 在 用 dir (fle) 的 时 候 会 
到 二 0 read/readline/readlines， 它 们 各 上 自 有 什么 特点 ? 为 什么 是 
函数 ? 


在 读者 看 下 面 的 内 容 之 前 ， 请 想 一 想 ， 如 采 要 回答 这 个 问题 ， 你 要 用 
什么 方法 ? 注意 ， 我 问 的 是 用 什么 方法 能 够 找到 答案 ， 不 是 问答 案 内 
容 是 什么 。 因 为 内 容 肯 定 在 某 个 地 方 存放 着 呢 ， 关 键 是 用 什么 方法 找 


le 
搜索 是 一 个 不 错 的 方法 。 
还 有 一 种 ， 就 是 在 交互 模式 下 使 用 的 ， 你 肯定 也 想到 了 。 


>>> help(file.read) 


用 这 样 的 方法 ， 可 以 分 别 得 到 三 个 函数 的 说 明 : 


read(...) 
read([size]) -> read at most Size bytes, returned as a string. 
If the size argument is negative or omitted, read until EOF is reached. 
Notice that when in non-blocking mode, less data than what was requested 
may be returned, even if no size parameter was given. 

readline(...) 
readline([size]) -> next line from the file, as a string. 
Retain newline. A non-negative size argument limits the maximum 
number of bytes to return (an incomplete line may be returned then). 
Return an empty string at EOF. 

readlines(...) 
readlines([size]) -> list of strings, each a line from the file. 
Call readline() repeatedly and return a list of the lines so read. 
The optional size argument, if given, is an approximate bound on the 


total number of bytes in the lines returned. 


对 照 一 下 上 面 的 说 明 ， 三 者 的 异同 就 显现 了 。 


在 上 面 的 文档 中 有 EOF， 它 是 什么 意思 ? End-of-file。 在 维基 百科 中 居 
然 有 对 它 的 解释 : 


In computing, End Of File (commonly abbreviated EOF[1]) isa 
condition in a computer operating system where no more data can be read 
from a data source.The data source is usually called a file or stream.In 
general, the EOF is either determined when the reader returns null as seen 
in Javas BufferedReader, [2]or sometimes people will manually insert an 
EOF character of their choosing to signal when the file has ended. 


明和 白 EOF 之 后 ， 来 对 比 一 下 。 


。 read: 如 果 指 定 了 参数 size， 束 按照 该 指定 长 度 从 文件 中 读 取 内 
容 ， 否 则 ， 就 读 取 全 文 。 被 读 出 来 的 内 容 ， 全 部 塞 到 一 个 字符 串 
里 面 。 这 样 有 好 处 ， 就 是 东西 都 到 内 存 里 面 了 ， 随 时 取 用 ， 比 较 
快捷 ; “成 也 外 何 败 也 肃 何 ”>， 也 是 因为 这 一 点 ， 如 果 文 件 内 容 太 
多 ， 内 存 会 吃不消 的 。 文 档 中 已 经 提醒 注意 在 “non-blocking” 模 式 
下 的 问题 ， 关 于 这 个 问题 ,不 是 本 记 的 重点 ， 暂 时 不 讨论 。 

。 readline: 那个 可 选 参数 size 的 含义 同上 。 它 以 行为 单位 返回 字符 
串 ， 也 了 就 是 每 次 读 一 行 ， 依 次 循环 ， 如 果 不 限 定 size， 直 到 最 后 
一 个 返回 的 是 空 字符 串 ， 意 味 着 到 文件 末尾 了 (EOF) 。 

。 readlines: size 同 上 。 它 返回 的 是 以 行为 单位 的 列表 ， 即 相当 于 先 
执行 readline()， 得 到 每 一 行 ， 然 后 把 这 一 行 的 字符 串 作 为 列表 中 
的 元 素 塞 到 一 个 列表 中 ， 最 后 将 此 列表 返回 。 


依次 演示 操作 ， 即 可 明了 “。 有 这 样 一 个 文档 ， 名 为 : youmd， 其 内 容 
和 基本 格式 如 下 : 


You Raise Me Up 


When I am down and, oh my soul, so weary; 
When troubles come and my heart burdened be; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains; 
You raise me up, to walk on stormy seas; 

I am strong, when I am on your shoulders,; 


You raise me up: To more than I can be. 


分 别 用 上 述 三 种 函数 读 取 这 个 文件 。 


>>> f = open("you.md") 
>>> content = f.read() 
>>> content 
'You Raise Me Up\nWhen I am down and, oh my soul, so weary;\nWhen troubles come and my heart burdened be;\nThen, I 
am still and wait here in the silence,\nUntil you come and sit awhile with me.\nYou raise me up, so I can stand on mo 
untains;\nYou raise me up, to walk on stormy seas;\nI am strong, when I am on your shoulders;\nYou raise me up: To mor 
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e than I can be.\n 


>>> f.close() 


提示 :” 养 成 一 个 好 习惯 ， 丈 一 定 要 随手 关闭 不 用 的 文件 。 如 果 不 关 
闭 ， 它 还 狂 留 在 内 存 中 ， 后 面 义 没有 对 它 的 操作 ， 既 浪费 内 存 空间 ， 
也 增加 了 文件 安全 的 风险 。 


注意 : 在 Python 中 ，"\n' 表 示 换 行 ， 这 也 是 UNIX 系 统 中 的 规范 。 但 
是 ， 在 奇 范 的 Windows 中 ， 用 Nn' 表 示 换 行 。 不 过 ， 还 好 Python 在 处 理 


的 时 候 ， 会 目 动 将 \rn' 转 换 为 \n。 


请 仔细 观察 ， 得 到 的 是 一 个 大 大 的 字符 串 ， 但 是 这 个 字符 串 里 面包 含 
春 一 些 符 号 m， 因 为 原文 中 有 换行 符 。 如 采用 print 答 出 这 个 字符 串 ， 
就 是 这 样 的 ， 其 中 的 mn 起 作用 了 。 


# 建 议 读 者 耐心 阅读 如 下 内 容 ， 并 到 网 上 搜索 这 首 歌曲 听 一 听 。 


>>> print content 

You Raise Me Up 

When I am down and, oh my soul, so weary; 
When troubles come and my heart burdened be; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains; 
You raise me up, to walk on stormy seas; 

I am strong, when I am on your shoulders; 


You raise me up: To more than I can be. 


用 readline() 读 取 ， 则 是 这 样 的 : 


>>> f = open("you.md") 

>>> f.readline() 

"You Raise Me Up\n' 

>>> f.readline() 

'When I am down and, oh my soul, so weary;\n' 
>>> f.readline() 

"When troubles come and my heart burdened be;\n' 


>>> f.close() 


显示 出 一 行 一 行 读 取 了 ， 每 操作 一 次 f.readline()， 束 读 取 一 行 ， 并 且 将 
指针 向 下 移动 一 行 ， 如 此 循环 。 显 然 ， 这 是 一 种 循环 ， 或 者 说 是 可 达 
代 的 。 因 此 ， 惑 可 以 用 循环 语句 来 完成 对 全 文 的 读 取 。 


#!/usr/bin/env python 


# coding=utf-8 
f = open("you.md") 


while True: 


line = f.readline() 


if not line: # 到 EOF， 返 回 空 字 符 串 ， 则 终止 循环 


break 


print line ， # 注 意 后 面 的 逗号 


f.close() # 别 忘记 关闭 文件 


将 其 和 文件 "you.md" 保 存在 同一 个 目录 中 ， 我 这 里 命名 的 文件 名 是 
J 然后 在 该 目录 中 运行 python 12701.py， 就 看 到 下 面 的 效果 


~/Documents$ python 12701.py 

You Raise Me Up 

When I am down and, oh my soul, so weary; 
When troubles come and my heart burdened be; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains; 
You raise me up, to walk on stormy seas; 

I am strong, when I am on your shoulders; 


You raise me up: To more than I can be. 


也 用 readlines() 来 读 取 此 文件 : 


>>> f = open("you.md") 
>>> content = f.readlines() 


>>> content 


[You Raise Me Up\n',When Iam down and,oh my soul,so weary;\n',' When 
troubles come and my heart burdened be;\n','Then,l am still and wait here in 
the silence,\n','Until you come and sit awhile with me.\n','You raise me 
up,so I can stand on mountains;\n',' You raise me up,to walk on stormy 
seas;\n','I am strong, when I am on your shoulders;\n',"You raise me up:To 
more than I can be.\n'] 


返回 的 十 一 个 列表 ， 列 表 中 每 个 元 素 都 是 一 个 字符 早 ， 每 个 字符 串 中 
的 内 容 束 古文 件 的 一 行文 字 ， 含 行 末 的 符号 。 显 而 易 见 ， 它 是 可 以 用 
for 来 循环 的 。 


>>> for line in content : 


print line 


You Raise Me Up 

When I am down and, oh my soul, so weary 

When troubles come and my heart burdened be; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains; 


You raise me up, to walk on stormy seas; 


I am strong, when I am on your Shoulders 
You raise me up: To more than I can be. 


>>> f.close() 


2.6.6 ”该 很 大 的 文件 


前 面 已 经 说 明了 ， 如 果 文 件 太 大 ， 束 不 能 用 read() 或 者 readlines() 一 次 
性 将 全 部 内 容 读 入 内 存 ， 可 以 使 用 while 循 环 和 readlin0) 来 完成 这 个 任 


务 。 


在 Python 中 ， 一 旦 遇 到 比较 特殊 的 、 环 手 的 问题 ， 往 往 有 好 的 工具 出 
现 。 在 对 付 很 大 的 文件 时 ， 就 有 一 个 模块 供 我 们 驱使 ， 名 einput 模 块 。 


>>> import fileinput 
>>> for line in fileinput.input("you.md"): 


print line 


You Raise Me Up 

When I am down and, oh my soul, so weary; 

When troubles come and my heart burdened be; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains; 
You raise me up, to walk on stormy seas; 

I am strong, when I am on your shoulders; 


You raise me up: To more than I can be. 


我 比较 喜欢 它 ， 用 起 来 非常 得 心 应 手 ， 人 简洁 明快 ， 还 有 for 。 


对 于 这 个 模块 的 更 多 内 容 ， 读 者 可 以 自己 在 交互 模式 下 利用 dir()、 
helpO 去 查看 明白 。 


诚然 ， 基 本 的 方法 也 不 是 不 能 用 的 。 


>>> for line in f: 


print line 


You Raise Me Up 

When I am down and, oh my soul, so weary; 
When troubles come and my heart burdened be; 
Then, I am still and wait here in the silence, 
Until you come and sit awhile with me. 

You raise me up, so I can stand on mountains; 


You raise me up, to walk on stormy seas; 


I am strong, when I am on your shoulders,; 


You raise me up: To more than I can be. 


之 所 以 能 够 如 此 ， 有 是 因为 fle 是 可 适 代 的 数据 类 型 ， 直 接 用 for 来 实现 送 


代 过 程 。 
2.6.7 seek() 
这 个 函数 的 功能 丈 是 让 指针 移动 。 比 如 ; 


>>> f = open("you.md") 
>>> f.readline() 

"You Raise Me Up\n' 
>>> f.readline() 


"When I am down and, oh my soul, so weary;\n' 


现在 已 经 移动 到 第 四 行 末 尾 了 ， 看 seek() 的 能 


>>> f.seek(0) 


意图 是 要 回 到 文件 的 最 开头 ， 那 么 如 果 用 freadline0 应 该 读 取 第 一 行 。 


>>> f.readline() 


"You Raise Me UpNn' 


果然 如 此 。 此 时 指针 所 在 的 位 置 还 可 以 用 tell0) 来 显示 ， 如 : 


>>> f.tell() 
风电 


>>> f.seek(4) 


f.seek (4) 束 将 位 置 定位 到 从 开头 算 起 的 第 四 个 字符 后 面 ， 也 就 
是 "You" 之 后 、 字 母 "R" 之 前 的 位 置 。 


4L 


SO 亿 是 这 么 说 的 * 这 时 候 如 果 使 用 eadlne0， 就 是 从 当前 位 置 开始 
I 行 未 。 


'Raise Me Up\n' 


>>> f.close() 


seek() 还 有 别 的 参数 ， 具 体 如 下 : 
seek (...) seek (offset[, whence]) ->None.Move to new file position. 


Argument offset is a byte count.Optional argument whence defaults to 0 
(offset from start of file, offset should be>=0) :other values are 1 
(move relative to current position, positive or negative) ，and 2 (move 
relative to end of file, usually negative, although many platforms allow 
seeking beyond the end of a file) .If the file is opened in text mode, only 
offsets returned by tell()are legal.Use of other offsets causes undefined 
behavior.Note that not all file objects are seekable. 


whence 的 值 : 


。 默认 值 是 0， 表 示 从 文件 开头 开始 计算 指针 偏 移 的 量 (人 简称 偏 移 
量 ) 。 这 时 offset 必 须 是 大 于 等 于 0 的 整数 。 

。 是 1 时 ， 表 示 从 当前 位 置 开始 计算 偏 移 量 。offset 如 果 是 负数 ， 则 
表示 从 当前 位 置 向 前 移动 ， 整 数 表示 癌 后 移动 。 

。 是 2 上 时， 表示 相对 文件 末尾 移动 。 


pa 人 


跟 一 些 比 较 牛 的 程序 员 交 流 ， 经 常 听 到 他 们 嘴 里 会 冒 出 不 标准 的 英文 

单词 ， 而 若 loop、iterate、traversal 和 recursion 不 在 其 内 ， 总 觉得 他 还 不 
人 够 牛 。 真 正 牛 的 程序 员 只 是 说 “循环 、 友 代 、 明 历 、 递 归 ”， 然 后 再 

”。 那 么 大 神 程 序 员 是 什么 样子 呢 ? 他 是 扫地 僧 ， 大 


先 搞 清楚 这 些 名 词 : 


。 人 循环 (loop) ， 指 的 是 在 满足 条 件 的 情况 下 ， 重 复 执 行 同一 段 代 
码 。 比 如 ，while 语 句 。 

。 友 代 Miterate) ， 指 的 是 按照 某 种 顺序 逐个 访问 对 象 中 的 每 一 项 。 
比如 ，for 语 句 。 

。 递归 (recursion) ， 指 的 是 一 个 函数 不 断 调 用 目 身 的 行为 。 比 
如 ， 以 编程 方式 输出 著名 的 斐 波 纳 丰 数列。 


。 怖 历 (traversal) ， 指 的 是 按照 一 定 的 规则 访问 树 形 结构 中 的 每 个 
节点 ， 而 且 每 个 节点 都 只 访问 一 次 。 
对 于 这 四 个 听 起 来 高 深 菜 测 的 词汇 ， 其 实 前 面 已 经 涉及 了 一 个 一 一 循 
环 (loop) ， 本 闻 主 要 介绍 一 下 迭代 (iterate) ， 在 网 上 搜索 一 下 束 会 
发 现 ， 对 迭代 和 循环 、 递归 进行 比较 的 文章 不 少 ， 分 别 从 不 同 角度 将 
它们 进行 了 对 比 。 这 里 暂 不 比较 ， 移 搞 明 日 Python 中 的 迭代 。 


en 


py 几时: 荫 = 
要 访问 对 象 中 的 每 个 元 素 ， 可 以 这 么 做 〈 例 如 一 个 list) : 


> lst 
[ 9， Ww', r] 
表 i in lst: 
print 3 
qiws 


除了 这 种 方法 ， 还 可 以 这 样 : 


>>> lst_iter = iter(lst) # 对 原来 的 list 实 施 了 一 个 iter() 
>>> lst_iter.next() # 要 不 厌 其 烦 地 一 个 一 个 手动 访问 
'q! 

>>> lst_iter.next() 


st_iter.next() 


> lst_iter.next() 


>> lst_iter.next() 


>> lst_iter.next() 


‘rr! 


>> lst_iter.next() 


Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


StopIteration 


iter0 古 一 个 内 建 钞 数 。 


nextO 吏 是 要 获得 下 一 个 元 素 ， 但 是 作为 一 名 优秀 的 程序 员 ， 节 佳品 质 
忠 古 “ 懒 悄 "， 当 然 不 能 这 样 一 个 一 个 地 融 ， 于 是 : 


>>> while True: 


print lst_iter.next() 
Traceback (most recent call last): # 报 错 ， 而 且 错 误 跟 前 面 一 样 ， 什 么 原因 


File "<stdin>", line 2, in <module> 


StopIteration 


先 不 管 错误 ， 表 来 一 过 。 


>>> lst_iter = iter(lst) # 错 误 暂 且 搁 置 ， 回 头 再 研究 


>>> while True: 


print lst_iter.next() 
q # 果 然 自动 化 地 读 取 了 
中 
Ww 
s 
和 
加 
Traceback (most recent call last): # 读 取 到 最 后 一 个 之 后 ， 报 错 ， 停 止 循环 


File "<stdin>", line 2, in <module> 


StopIteration 


目 先 了 解 一 下 上 面 用 到 的 那个 内 置 瑟 数 ，iter()， 官 方 文档 中 有 这 样 一 
段 话 描述 之 : 


iter (of, sentinel]) 


Return an iterator object.The first argument is interpreted very differently 
depending on the presence of the second argument.Without a second 
argument，o must be a collection object which supports the iteration 
protocol (the iterOmethod) , or it must support the sequence protocol 

(the getitem(Omethod with integer arguments starting at 0) .If it does not 
support either of those protocols, TypeError is raised.If the second 
argument, sentinel, is given, then o must be a callable object.The 
iterator created in this case will call o with no arguments for each call to its 
next()method;if the value returned is equal to sentinel, Stoplteration will 
be raised, otherwise the value will be returned. 


提炼 一 下 此 段 主要 的 东西 : 


。 返回 值 是 一 个 迭代 器 对 象 。 
。 参数 需要 是 一 个 符合 友 代 协议 的 对 象 或 者 是 一 个 序列 对 象 。 
。 next() 配 合 与 之 使 用 。 


我 们 常常 将 那些 能 够 用 诸如 循环 语句 之 类 的 方法 来 一 个 一 个 地 读 取 元 
5 就 称 为 可 友 代 的 对 象 。 那 么 用 来 循环 的 《如 for) 就 称 为 迭 
:十 上。 


用 疡 格 一 点 的 语言 说 : 所 谓 迭 代 工 具 ， 殉 是 能 够 按照 一 定 顺 序 扫 摘 迭 
代 对 和 象 的 每 个 元 素 (按照 从 左 到 右 的 顺序 ) 。 


显然 ， 除 了 for 之 外 ， 还 有 别 的 迭代 工具 。 


那么 ， 刚 才 介 绍 的 iter0 的 功能 呢 ? 它 与 nextO 配 合 使 用 ， 也 有 实现 上 述 
迭代 工具 的 作用 。 


在 Python 中 ， 甚 至 在 其 他 的 语言 中 ， 关 于 迭代 的 说 法 比较 乱 ， 主 要 是 
名 词 乱 ， 刚 才 我 们 说 ， 那 些 能 够 实现 迭代 的 工具 ， 称 为 迭代 工具 ， 整 
是 这 些 达 代 工具 ， 不 少 程序 员 都 喜欢 叫 作 壕 代 絮 。 当 然 ， 这 都 是 汉语 
翻译 ， 英 语 就 是 iterator 。 


从 例子 中 会 发 现 ， 如 果 用 for 来 送 代 ， 当 到 末尾 的 时 候 就 自动 结束 了 ， 
“会 报错 。 如 果 用 iter0...next0 送 代 ， 当 最 后 一 个 完成 之 后 不 会 自动 结 
束 ， 还 要 继续 向 下 ， 但 是 后 面 没有 元 素 了 ， 于 是 就 报 一 个 称 之 为 
Stoplteration 的 错误 (这 个 错误 的 名 字 叫 作 停止 次 代 ， 这 哪里 是 报错 ， 
分 明 是 警告 ) 。 


读者 还 要 关注 iter()...next0 迭 代 的 一 个 特点 。 当 过 代 对 象 lst_iter 被 从 代 
结束 ， 即 每 个 元 素 都 读 取 了 一 这 之 后 ， 指 针 束 移动 到 了 最 后 一 个 元 素 
的 后 面 。 如 果 再 访问 ， 指 针 并 没有 目 动 返 回 到 首位 置 ， 而 是 仍然 停留 
在 玉 位 置 ， 所 以 报 StopIteration， 想 要 再 开始 ， 束 需要 重 狐 载 入 迭代 对 
象 。 所 以 ， 当 我 在 上 面 重新 进行 迭代 对 象 赋值 之 后 ， 叉 可 以 继续 了 。 

这 种 情况 在 for 等 类 型 的 迭代 工具 中 是 没有 的 。 


2.7.2 文件 迭代 楷 


有 一 个 文件 ， 名 称 是 208.txt， 其 内 容 如 下 : 


Learn python with qiwsir. 
There is free python course. 
The website is: 
http://qiwsir.github.io 


Its language is Chinese. 


用 迭代 瑚 来 操作 这 个 文件 : 


>>> f = open("208.txt") 

>>> f.readline() # 读 第 一 行 
"Learn python with qiwsir.\n' 

>>> f.readline() # 读 第 二 行 
"There is free python course.\n' 

>>> f.readline() # 读 第 三 行 


"The website is:\n' 


>>> f.readline() # 读 第 四 行 
'http://qiwsir.github.io\n' 
>>> f.readline() # 读 第 五 行 ， 也 就 是 最 后 一 行 


"Its language is Chinese.\n' 


>>> f.readline() # 无 内 容 了 ， 但 是 不 报错 ， 返 回 空 


以 上 演示 的 是 用 readline0 一 行 一 行 地 读 。 当 然 ， 在 实际 操作 中 ， 我 们 
是 绝对 不 能 这 样 做 的 ， 一 定 要 让 它 目 动 进行 ， 比 较 常 用 的 方法 是 : 


>>> for line in f: 


print line, 


这 段 代码 之 所 没有 打印 出 东西 来 ， 是 因为 经 过 前 面 的 达 代 ， 指 针 已 经 
移 到 了 最 后 。 这 就 是 迭代 的 一 个 特点 ， 要 小 心 指针 的 位 置 。 


>>> f = open("208.txt") # 从 头 再 来 


>>> for line in f: 


print line, 


Learn python with qiwsir. 
There is free python course. 
The website is: 
http://qiwsir.github.io 


Its language is Chinese. 


这 种 方法 是 读 取 文件 常用 的 。 男 外 一 个 readlines() 也 可 以 。 但 是 ， 需 
小 心 探 作 。 


上 面 过 程 用 next() 也 能 够 实现 。 


>>> f = open("208.txt") 

>>> f.next() 

"Learn python with qiwsir.\n' 
>>> f.next() 

'There is free python course.\n' 
>>> f.next() 

"The website is:\n' 

>>> f.next() 
'http://qiwsir.github.io\n' 

>>> f.next() 


"Its language is Chinese.\n' 


>>> f.next() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


StopIteration 


如 果 用 nextO0， 就 可 以 直接 读 取 每 行 的 内 容 ， 这 说 明文 件 是 天 然 的 可 迭 
代 对 象 ， 不 需要 用 iter0 转 换 。 

再 有 ， 我 们 用 for 来 实现 迭代 ， 在 本 质 上 就 是 自动 调用 next()， 只 不 过 
这 个 工作 已 经 让 for 偷 偷 地 替 我 们 干 了 ， 到 这 里 应 该 双 全 for 取 另外 一 个 名 


字 : 雷锋 。 


列表 解析 也 能 够 作为 迄 代 工具 ， 在 人 研究 列表 的 时 候 ， 想 必 已 经 
了 。 那 么 对 文件 ， 是 否 可 以 用 ? 试 一 试 : 


>>> [ line for line in open('208.txt') ] 


['Learn python with qiwsir.\n', 'There is free python course.\n', 'The website is:\n', 'http://qiwsir.github.io\n' 


,， 'Its language is Chinese.\n'] 


至 此 ， 看 官 难道 还 不 为 列表 解析 的 强大 鬼 力 所 折服 吗 ? 真 的 很 强大 。 


其 实 ， 迭 代 亏 远 远 不 止 上 述 这 么 简单 ， 下 面 我 们 随便 列举 一 些 ， 在 
Python 中 还 可 以 这 样 得 到 迭代 对 象 中 的 元 素 。 


>>> list(open('208.txt')) 


['Learn python with qiwsir.\n', 'There is free python course.\n', 'The website is:\n', 'http://qiwsir.github.io\n' 


,， 'Its language is Chinese.\n'] 


>>> tuple(open('208.txt')) 


('Learn python with qiwsir.\n', 'There is free python course.\n', 'The website is:\n', 'http://qiwsir.github.io\n' 
/ 'Its language is Chinese.\n') 


>>> "$$$".join(open('208.txt')) 


"Learn python with qiwsir.\n$$$There is free python course .\n$$$The website is:\n$$$http://qiwsir.github.io\n$$$It 
S language is Chinese.\n' 


>> a,b,c,d,e = open("208.txt") 


'http://qiwsir.github.io\n' 


'Its language is Chinese.\n' 


上 述 方 式 在 编程 实践 中 不 一 定 用 得 上 ， 只 是 秀一 下 可 以 这 么 做 ， 但 不 
征 非 要 这 么 做 。 


字典 是 否 可 人 适 代 ? 可 以 。 读 者 不 妨 自 己 仿 照 前 面 的 方法 摸索 一 下 (其 
已 经 用 for 失 代 过 了 ， 这 次 请 用 iter0...nextO 手 动 一 步 一 步 迭 
代 ) 。 


第 3 草 ” 团 效 


对 于 人 类 来 讲 ， 画 数 能 够 发 展 到 这 个 数学 思维 层次 钙 一 个 飞 路。 可 以 
说 ， 男 数 的 提出 直接 加 快 了 现代 科技 和 社会 的 发 展 ， 现 代 的 任何 科技 
门类 ， 力 至 经 济 学 、 政 治学 、 社 会 学 等 ， 都 已 经 普遍 使 用 范 数 。 


下 面 一 段 症 来 目 维基 百科 关于 函数 的 词 条 。 


函数 这 个 数学 名 词 是 莱 布 尼 效 在 1694 年 开始 使 用 的 ， 以 描述 曲线 的 一 
个 相关 量 ， 如 曲线 的 斜率 或 者 曲线 上 的 某 一 点 。 莱 布 尼 兹 所 指 的 函数 
现在 被 称 作 可 导 画 数 ， 数 学 家 之 外 的 普通 人 一 般 接触 到 的 函数 即 属 此 
类 。 对 于 可 导 函 数 可 以 讨论 它 的 极限 和 导数 。 此 两 者 描述 了 函数 输出 
值 的 变化 同 输入 值 变 化 的 关系 ， 征 微 积分 学 的 基础 。 


中 文 的 “ 芳 数 ”一 词 由 清朝 数学 家 他 普兰 译 出 。 其 《代数 学 》 书 中 解 
释 :“ 凡 此 变量 中 芳 (包含 ) 彼 变 量 者 ， 则 此 为 彼 之 函数 ”。 


函数 ， 从 简单 到 复杂 ， 各 式 各 样 。 但 不 管 什么 样子 的 函数 ， 都 可 以 用 
图 3-1 概 括 。 


下 面 说 明 Python 中 的 函数 和 相关 问题 。 


| INPUT 


FUNCTION 
f: 


! 


| OUTPUT 


f(x) 


图 3-1 ” 画 数 


3.1 理解 函数 


在 中 学 数学 中 ， 可 以 用 这 样 的 方式 定义 画 数 ，y=4x+3， 这 就 是 一 个 一 
Ue 也 可 以 写成 : f (x) =4x+3。 其 中 x 是 变量 ， 它 可 以 代 
可 数 。 


当 x=2 时 ， 代 入 到 上 面 的 函数 表达 式 : 

f (2) =4*2+3=11 

所 以 : f (2) =11 

但 是 ， 这 并 不 是 函数 的 全 部 ， 其 实在 函数 中 ， 并 没有 规定 变 


量 只 能 
一 个 数 ， 0 还 可 以 是 荚果， 不 知道 读者 是 否 对 函数 有 这 
个 层次 的 理解 ， 继 续 阅 读 会 理解 更 深刻 。 


3.1.1 变量 不 仅仅 古 数 


变量 x 只 能 是 任意 数 吗 ? 其 实 ， 一 个 函数 ， 束 是 一 个 对 应 关系。 读者 壬 
试 着 将 上 面 表 达 式 的 x 理解 为 馅 饼 ，4x+3， 束 是 4 个 馅 饼 加 上 3 (一 上 般 
来 讲 ， 单 位 是 统一 的 ， 但 你 非 让 它 不 统一 也 无 妨 ) ， 这 个 结果 对 应 着 
男 外 一 个 东西 ， 那 个 东西 比如 说 是 iPhone。 或 者 说 可 以 理解 为 4 个 馅 饼 
加 3 束 对 应 一 个 iPhone， 这 融 是 所 谓 的 映射 关系 。 


所 以 ，x 不 仅仅 是 数 ， 还 可 以 是 你 认为 的 任何 东西 。 
变量 本 质 上 是 占 位 符 


玉 数 中 为 什么 变量 用 x? 这 是 一 个 有 趣 的 问题 ， 目 己 搜 索 一 仆 ， 看 能 不 
能 找到 答案 。 


我 也 不 清楚 原因 。 不 过 ， 我 清楚 地 知道 ， 变 量 可 以 用 x， 也 可 以 用 别 的 
符号 ， 甚 至 用 alpha、beta 这 样 的 字母 组 合 也 可 以 。 


变量 在 本 质 上 融 是 一 个 占 位 符 ， 这 是 一 针 见 血 的 理解 。 什 么 是 占 位 
符 ? 驶 是 移 把 那个 位 置 用 变量 占 上 ， 表 示 这 里 有 一 个 东西 ， 至 于 这 个 
以 后 再 说 ， 反 正 先 用 一 个 符号 占 着 这 个 位 置 〈 占 位 
从 ) 。 


其 实在 高 级 语言 编程 中 ， 变 量 比 我 们 在 初中 数学 中 学 习 的 要 复杂 。 但 
， 先 不 管 那些 ， 现 在 ， 就 按照 初中 数学 的 难度 来 研究 Python 中 的 变 


地 外 


在 Python 中 ， 通 常用 小 写字 母 来 命名 变量 ， 也 可 以 在 其 中 加 上 下 夯 
线 ， 以 表示 区 别 。 


3.1.2 建立 简单 函数 


>>a=2 
>>> y=3*a+2 
>>> y 

8 


这 种 方式 建立 的 函数 ， 与 在 初中 数学 中 学 习 的 没有 什么 区 别 。 当 然 ， 
这 种 方式 的 函数 在 编程 实践 中 没什么 用 途 ， 仅 仅 在 这 里 冒 出 来 ， 后 面 


绝对 不 用 这 个 形式 了 。 
输入 a=3， 然 后 输入 y， 看 看 得 到 什么 结果 呢 ? 


征 不 是 很 奇怪 ? 已 经 让 a 等 于 3 了 ， 为 什么 结果 y 还 是 8? 


还 记得 前 面 已 经 学 习 过 的 关于 “变量 赋值 ”的 原理 吗 ? a=2 的 合 义 是 将 2 
这 个 对 象 贴 上 了 变量 a 的 标签 ， 经 过 计算 ， 得 到 了 8， 之 后 变量 y 引 用 了 
对 象 8。 当 变量 a 引 用 的 对 象 修改 为 3 的 时 候 ， 但 是 y 引 用 的 对 象 还 没有 
变 ， 所 以 还 是 8。 再 计算 一 次 ，y 的 连接 对 象 束 变 了 : 


> a=3 


特别 注意 ， 如 果 没 有 预 匈 令 a=2， 直 接 写 函数 表达 式 则 会 报错 。 


注意 看 错误 提示 ，a 是 一 个 变量 ， 提 示 中 各 诉 我 们 这 个 区 量 没 有 定义 。 
显然 ， 如 条 函数 中 要 使 用 某 个 变量 ， 不 得 个 提前 定义 出 来 ， 定 义 方法 
忠 古 给 这 个 变量 赋值 。 


3.1.3 ”建立 实用 的 函数 
机 


nn 那么 就 来 写 一 个 .py 文件 
np 。 


例如 ， 下 面 的 代码 : 


#!/usr/bin/env python 


#coding:utf-8 


def add_function(a, b): 


add_function(2, 3) 


然后 将 文件 保存 ， 我 把 它 命名 为 20101.py， 你 根据 自己 的 喜好 取 个 名 
子 O 


然后 殉 进 入 到 那个 文件 夹 ， 运 行 这 个 文件 ， 出 现下 面 的 结果 : 


qw@qw-Latitude-E4300:~/Documents/ITArticles/Basicpython/codes$ ls 

105-1.py 1i05.py 106-1.p 
qw@qw-Latitude-E4360:~/Documents/ITArticles/Basicpython/codes$ python 106-1.py 
5 


qw@qw-Latitude-E4360:~/Documents/ITArticles/Basicpython/codess | 


你 运行 的 结果 是 什么 ?如 果 没 有 得 到 上 面 的 结果 ， 就 要 非常 认真 地 检 
查 代 码 ， 注 意 ， 冒 号 和 空格 都 得 一 样 ， 因 为 冒号 和 空格 也 很 重要 。 


下 面 开始 应 丁 解 牛 。 


。 def add_function (a，b) : 这 是 函数 的 开始 。 在 声明 要 建立 一 个 
一 定 要 使 用 def (def 就 是 英文 define 的 前 三 个 字 
母 ) 是 告知 计算 机 ， 这 里 要 声明 一 个 函数 ;add_function 
是 这 个 画 函数 名 称 ， 取 和 名字 是 有 讲究 的 ， 就 好 比 你 的 名 字 一 样 。 在 
?ython 中 取 名 字 的 讲 完 就 是 要 有 一 定 意义 ， 能 够 从 名 字 中 看 出 这 
个 函数 是 用 来 干什么 的 。 从 add_function 这 个 名 字 中 ， 可 以 看 出 它 
是 用 来 计算 加 法 的 (严格 地 说 是 把 两 个 对 象 “ 相 加 ”， 这 里 相 加 的 
含义 是 比较 宽泛 的 ， 包 括 对 字符 串 等 相 加 ) 。 (a，b) 这 个 括号 
里 面 的 是 这 个 函数 的 参数 ， 0 冒号 非常 非常 重 
A ， 就 会 报错 。 冒 号 的 意思 就 是 下 面 开始 真正 的 函数 

容 

。 c=a+b: 这 一 行 比 上 一 行 要 缩 进 四 个 空格 。 这 是 Python 的 规定 ， 要 
牢记 和 天 天 于 了 就 报错 。 然 后 这 句 话 就 是 将 两 个 参数 相 
加 ， 结 果 赋 值 与 另外 一 个 变量 c 。 


。 pe 还 是 提醒 注意 ， 缩 进 四 个 空格 。 将 得 到 的 结果 c 的 值 打 印 

。 计 _name_=="_main _": 这 句 话 先 照抄 ， 不 解释 〈 后 面 会 做 解 
释 的 ) 。 注 意 的 地 方 就 是 不 缩 进 了 。 

。add_function (2，3) : 这 才 是 真正 调用 前 面 建 立 的 函数 ， 并 且 传 
入 两 个 参数 : a=2，b=3。 仔 细 观 察 传 入 参数 的 方法 ， 就 是 把 2 放 
在 a 那 个 位 置 ，3 放 在 b 那 个 位 置 。 


解 牛 完毕 ， 做 个 总 结 。 


定义 函数 的 格式 为 : 


def 画 数 名 (参数 1， 参 数 2，. . .， 参 数 n ): 


画 数 体 (语句 块 ) 


征 不 是 样式 很 简单 呢 ? 
几 点 说 明 : 


。 函数 名 的 命名 规则 要 符合 Python 中 的 命名 要 求 。 一 般 用 小 写字 母 
和 单 下 画 线 、 数 字 等 组 合 。 

def 是 定义 函数 的 天 键 词 ， 这 个 位 写 来 日 英文 单词 define 。 
Od 
参 妈 X“ 

干 力 不 要 臣 记 了 扫 号 后 面 的 由 号 * 

函数 体 〈 语 句 块 ) ， 相 对 于 def 缩 进 ， 按 照 Python 的 习惯 ， 缩 进 四 


sp 
个 空格 。 
EA y 
再 通过 简单 的 例子 ， 深 入 理解 上 面 的 要 点 : 

>>> def name(): # 定 义 一 个 无 参数 的 函数 
print "qiwsir" # 缩 进 4 个 空格 

>>> name () # 调 用 画 数 ， 打 印 结果 

qiwsir 

>>> def add(x, y): # 定 义 一 个 非常 简单 的 函数 
return x+y # 缩 进 4 个 空格 

>> add(2, 3) # 计 算 2+3 


注意 上 面 的 add (x，y) 画 数 ， 没 有 特别 规定 参数 “x，y” 的 类 型 。 其 
实 ， 这 句 话 本 身 就 是 错 的 ， 前 面 已 经 多 次 提 到 ， 在 Python 中 ， 变 量 无 
类 型 ， 只 有 对 象 才 有 类 型 ， 这 句 话 应 该 说 成 : “x，y 并 没有 严格 规定 
其 所 引用 的 对 象 类 型 。 这 是 Python 跟 某 些 语言 很 大 的 区 别 ， 在 有 些 语 
言 中 ， 需 要 在 定义 本 数 的 时 修 告诉 本 数 参数 的 数据 关 型 ，Pythou 不 用 


为 什么 ? 读者 不 要 乓 记 了 ， 这 里 的 所 谓 参 数 跟前 面 说 的 变量 本 质 上 有 是 

- 回 事 。 只 有 当 用 到 该 变量 的 时 候 ， 才 建立 变量 与 对 象 的 对 应 关系， 
否则 ， 关 系 不 建立 。 只 有 对 象 才 有 类 型 ， 那么， 在 add (x，y) 画 数 
中 ,“x， 史 在 引用 对 象 之 前 是 完全 肚 忽 的 ， 没 有 被 贴 在 任何 一 个 对 象 
上 ， 换 句 话 说 它们 有 可 能 引用 任何 对 象 ， 只 要 后 面 的 运算 许可 。 如 有 果 
后 面 的 运算 不 许可 ， 则 会 报错 。 


nate 'str' and 'int' objects # 仔 细 阅 读 报错 信息 


从 实验 结果 中 发 现 : x+y 的 意义 完全 取决 于 对 象 的 类 型 。 在 Python 中 ， 
将 这 种 依赖 天 系 称 之 为 多 态 。 对 于 Python 中 的 多 人 态 问 题 以 后 还 会 下 
到 ， 这 里 仅仅 以 此 例子 显示 一 番 。 请 读者 要 留心 注意 ;' Python 中 为 对 
象 编写 接口 ， 而 不 古 为 数据 类 型 编写 。 读 者 先 留心 一 下 这 人 句 话 ， 或 者 
记 住 它 ， 随 着 学 习 的 深入 ， 会 领情 到 其 真 席 的 。 


此 外 ， 也 可 以 将 画 数 通过 赋值 语句 与 某 个 变量 建立 引用 关系 : 


>>> result = add(3, 4) 


这 其 实 解释 了 函数 的 一 个 秘密 : add (x，y) 被 运行 之 前 ， 在 计算 机 内 
是 不 存在 的 ， 直 到 代码 运行 到 这 里 的 时 候 ， 在 计算 机 中 就 建立 起 来 了 
一 个 对 象 ， 这 就 如 同 前 面 所 学 习 过 的 字符 串 、 列 表 等 类 型 的 对 象 一 

样 ， 运 行 add (x，y) 之 后 ， 也 建立 了 一 个 add (x，y) 的 对 象 ， 这 个 
对 象 与 变量 result 可 以 建立 引用 关系 ， 并 且 add (x，y) 将 运算 结果 返 


问 。 请 注意 函数 中 的 return， 它 的 作用 就 是 要 把 函数 的 结果 返回 ， 从 而 
得 到 这 个 函数 的 返回 值 。 于 钙 ， 通 过 result 束 可 以 查看 运算 结 末 。 


如 有 果 对 上 面 一 段 感觉 有 点 吃力 或 者 尝 平 ， 那 束 再 读 一 裔 。 寿 实在 捅 不 
明白 ， 也 别 担心 ， 随 着 学 习 的 深入 ， 会 明日 的 。 


3.1.4 ”关于 命名 


到 现在 为 止 ， 我们 已 经 接触 过 变量 的 命名 和 画 数 的 命名 问题 ， 似 乎 已 
经 到 了 将 命名 问题 进行 总 结 的 时 候 了 。 


人 取 名 字 或 者 给 什么 东西 命名 ， 常 常 是 天 大 的 事 
情 。 


Python 也 很 在 乎 名 字 问 题 ， 其 实 ， 所 有 高 级 语言 对 名 字 都 有 有 要求 。 为 
» 0 计算 机 可 有 点 不 知 所 措 了 。 看 Python 对 
命名 的 一 般 要 求 。 


。 文件 名 : 全 小 写 ， 可 使 用 下 画 线 。 

。 函数 名 : 小 写 ， 可 以 用 下 画 线 风格 单词 以 增加 可 读 性 。 如 ; 
my_function、my_example_function。 注 意 : 混合 大 小 写 仅 被 允许 
用 于 这 种 风格 已 经 占据 优势 的 时 候 ， 以 便 保持 向 后 兼容 。 有 的 人 
喜欢 用 这 样 的 命名 风格 :myFunction， 除 了 第 一 个 单词 首 字 本 
0 。 这 也 是 可 以 的 ， 因 为 在 某 些 语言 中 
就 习惯 如 此 。 

函数 的 参数 : 如 果 一 个 函数 的 参数 名 称 和 保留 的 关键 字 冲 突 ， 通 
党 使 用 一 个 后 缀 下 画 线 。 

变量 : 变量 名 全 部 小 写 ， 由 下 画 线 连接 各 个 单词 。 如 
color=WHITE, this is a variable=1 ° 


其 实 ， 关 于 命名 的 问题 ， 还 有 不 少 争 论 ， 最 典型 的 是 所 请 匈牙利 命名 


法 、 驼 峰 命 名 等 。 


Python 本 号 有 一 套 命 名 的 官方 规范 ， 读 者 可 以 参考 : 
http://legacy.python.org/dev/peps/pep-0008/#prescriptive-naming- 
conventions ° 


3.1.5 ”调用 函数 


前 面 的 例子 中 已 经 有 了 一 些 天 于 调用 的 问题 ， 为 了 深入 理解 ， 把 这 个 


问题 单独 拿 出 来 看 看 。 


为 什么 要 写 画 数 ? 从 理论 上 说 ， 不 用 函数 也 能 够 编程 ， 


我 们 在 前 面 已 


经 写 了 程序 ， 束 没有 写 画 数 ， 当 然 ， 用 Python 的 内 建 画 数 姑且 不 算 。 


之 所 以 使 用 函数 主要 原因 是 : 


。 降低 编程 的 难度 ， 通 营 将 一 个 复杂 的 大 问题 分 解 成 一 系列 更 简单 


的 小 问题 ， 然 后 将 小 问题 继续 划分 成 更 小 的 问题 ， 


当 问 题 细 化 为 


足够 简单 时 ， 束 可 以 分 而 治之 。 为 了 实现 这 种 分 而 治之 的 设想 ， 
束 要 通过 编写 函数 ， 将 各 个 小 问题 未 个 击破 ， 青 集合 起 来 ， 解 决 
大 的 问题 。 (请 注意 ， 分 而 治之 的 思想 是 编程 的 一 个 重要 思想 ， 


Dri /> 


代码 重用 。 在 编程 的 过 程 中 ， 比 较 忌 讳 同样 一 段 代码 不 断 重 复 ， 


所 以 ， 定 义 一 个 画 数 ， 可 以 多 次 被 使 用 。 当 然 ， 后面 我 们 还 会 讲 
到 “模块 "， 还 可 以 把 函数 放 到 一 个 模块 中 供 其 他 程序 员 使 用 。 也 
可 以 使 用 其 他 程序 员 定义 的 函数 (比如 import， 前 面 已 经 用 到 


了 ， 职 是 应 用 了 别人 创造 Python 的 人 
束 避 优 了 重复 劳动 ， 提 高 了 工作 效率 。 


写 好 的 函数 ) ， 这 


这 样 看 来 ， 使 用 函数 还 是 很 有 必要 的 。 下 面 恩 看 图 数 怎么 调用 吧 。 以 
0 


>>> def add(x, y): 
print "x=", x 
print "y=", y 


return x+y 


>>> add(10, 3) #X=10, y=3 
x= 10 
JE 


13 


>>> add(3, 10) #X=3, y=10 
X= 3 
y= 10 


13 


所 谓 调用 ， 最 关键 是 要 弄 清楚 如 何 给 画 数 的 参数 赋值 
参数 次 序 赋值 ， 根 据 参 数 的 位 置 ， 值 与 之 对 应 。 


。 这 里 就 古 按 照 


还 可 以 直接 把 赋值 语句 写 到 里 面 ， 束 明确 了 参数 和 对 象 的 关系 。 


>>> add(x=10，y=3) # 同 上 


x= 10 
y= 3 


13 


当然 ， 这 时 候 顺 序 束 不 重要 了 ， 也 可 以 这 样 : 


>>> add(y=10, x=3) 
X= 3 
y= 10 


13 


在 定义 函数 的 时 候 ， 参 数 可 以 像 前 面 那样 等 待 被 赋值 ， 也 可 以 定义 的 
时 候 整 赋 给 一 个 默认 值 。 例 如 : 


>>> def times(x, y=2): 
print "x=", x 


print "y=", y 


return x * y 
>>> times(3) 
X= 3 
y= 2 
6 
>>> times(x=3) 
X= 3 
y= 2 
6 


如 采 不 给 那个 有 默认 值 的 参数 传递 值 (赋值 的 男 外 一 种 说 法 ) ， 那 么 
它 束 是 用 默认 的 值 。 如 有 果 给 它 传 一 个 ， 则 采用 痢 赋 给 它 的 值 。 如 下 : 


>>> times(3，4) #X=3, y=4, y 的 值 不 再 是 2 
X= 3 

y= 4 

2 

>>> times("qiwsir") # 再 次 体现 了 多 态 特点 

x= qiw 

y= 2 


给 各 位 读者 提 一 个 思考 题 ， 请 在 朵 暇 之 余 用 Python 完成 : 写 两 个 数 的 
加 、 减 、 乘 、 除 的 函数 ， 然 后 用 这 些 画 数 ， 完 成 位 单 的 计算 。 


3.1.6 注意 事项 


所 网 号 程 订 的 注意 事项 单独 作为 一 个 小 节 提 出 ， 目 的 是 提醒 读者 注 
， 因 为 这 些 方面 的 问题 ， 往 往 成 为 困扰 读者 (特别 是 初学 者 ) 的 麻 


质 。 


。 别 馈 了 冒号 。 一 定 要 记 住 符合 语句 首 行 末尾 输入 “: ” (if， 
while，for 等 的 第 一 行 ) 。 

从 第 一 行 开始 。 要 确定 顶层 (无 航 套 ) 程序 代码 从 第 一 行 开 始 。 
空白 行 在 交互 模式 提示 符 下 很 重要 。 模 块 文件 中 符合 语句 内 的 空 
日 行 常 被 忽视 。 但 是 ， 当 你 在 交互 模式 提示 符 下 输入 代码 时 ， 空 
日 行 则 会 结束 语句 。 

缩 进 要 一 致 。 避 免 在 块 缩 进 中 混合 制 表 符 和 空格 。 

使 用 简洁 的 for 循 环 ， 而 不 是 while or range。 相 比 ，for 循 环 更 易 
写 ， 运 行 起 来 也 更 快 。 

要 注意 赋值 语句 中 的 可 变 对 象 。 

不 要 期 竺 在 原 处 修改 的 函数 会 返回 结果 ， 比 如 listappend0， 这 在 
可 修改 的 对 象 中 要 特别 注意 。 

调用 函数 时 ， 函 数 名 后 面 一 定 要 跟随 着 括号 ， 有 时 候 括 号 里 面 就 
是 空空 的 ， 有 时 候 里 面 放 参数 。 

不 要 在 导入 和 重 载 ( 先 记 住 有 这 样 一 个 名 词 ， 后 面 会 反复 出 现 ， 
慢 慢 束 能 理解 合 义 了 ， 实 在 勾 不 住 束 搜索 一 下 。) 中 使 用 扩展 名 


或 路 径 。 


以 上 各 扩 如 案 有 个 理解 和 也 个 要 淆 ， 在 以 后 编程 中 ， 时 不 时 地 回来 复 
习 一 下 ， 能 不 断 领 司 其 内 尊 


3.1.7 返回 值 


前 面 写 的 钞 数 有 点 缺憾 ， 不 知道 读者 十 否 党 察 到 了 ， 即 结果 是 用 print 
语句 打印 出 来 的 。 这 有 征 实际 编程 中 广泛 使 用 的 吗 ? 肯定 不 是 。 因 为 画 
数 在 编程 中 是 一 段 具 有 抽象 价值 的 代码 ， 一 般 情 况 下 ， 用 它 得 到 一 个 
结 采 ， 这 个 结果 要 用 在 其 他 的 运算 中 。 所 以 ， 不 能 仅仅 局 限 在 把 某 个 
结果 打印 出 来 ， 函 数 必 须 返 回 一 个 结果 。 


为 了 能 够 说 明 清 楚 ， 先 编写 一 个 国 数 。 


根据 高 德 纳 (Donald Ervin Knuth) 的 《计算 器 程序 设计 艺术 》 (The 

Art of Computer Programming) ，1150 年 印度 数学 家 Gopala 和 人 金 月 在 研 
完 箱 子 包 装 对 象 长 宽 刚 好 为 1 和 2 的 可 行 方法 数目 时 ， 首 先 描述 这 个 数 
列 。 在 西方 ， 最 先 研 究 这 个 数列 的 人 是 比 陕 的 李 奥 纳 多 “意大利 人 斐 
Fibonacci) ， 他 在 描述 兔子 生长 的 数目 时 用 上 了 这 个 
数列 。 


第 一 个 月 初 有 一 对 刚 诞生 的 兔子 ， 第 二 个 月 之 后 (第 三 个 月 初 ) 它们 
0 育 ， 每 月 每 对 可 生育 的 兔子 会 诞生 下 一 对 新 兔子 ， 免 子 永 不 死 


假设 在 n 月 有 可 生育 的 兔子 总 共 a 对 ，n+l 月 吏 总 共有 b 对 。 在 n+2 月 必 

定 总 共有 a+b 对 : > 因为 在 n+2 月 的 时 候 ， 前 一 月 (n+1 月 ) 的 b 对 兔子 

可 以 存留 至 第 n+2 月 〈 在 当月 属于 新 诞生 的 兔子 尚 不 能 生育 ) 。 而 新 

生育 出 的 兔子 对 数 等 于 所 有 在 n 月 就 已 存在 的 a 对 。 

Ee 从 而 可 以 实现 任意 的 数 
|| 0o 


参考 代码 : 


#!/usr/bin/env python 


# coding=utf-8 


def fibs(n): 
result = [9, 1] 
for i in range(n-2): 
result.append(result[-2] + result[-1]) 


return resu 1t 


if name 


lst = fibs(10) 


print lst 


把 合 有 这 些 代 码 的 文件 保存 成 名 为 20202.py 的 文件 。 


在 这 个 文件 中 ， 站 人 先 定义 了 一 个 图 数 ， 名 字 叫 作 fibs， 其 参数 是 输入 一 
个 整数 〈 当 然 ， 画 数 并 没有 对 此 进行 限制 ， 也 没有 必要 限制 ， 这 就 是 


Python 的 脾气 和 性 格 。) 。 然 后 ， 通 过 ]st=fibs (10) 调用 这 个 函数 。 
这 里 参数 给 的 是 10， 束 意味 痢 要 得 到 n=10 的 裴 波 那 问 数列 。 
运行 后 打印 数列 : 


$ python 20202.py 


[0, 1, 1, 2, 3, 5, 8, 13, 21, 34] 


当然 ， 如 果 要 换 n 的 值 ， 只 需要 在 调用 画 数 的 时 候 ， 修 改 一 下 参数 即 
可 ， 这 才 体现 出 丽 数 的 优势 呢 。 


观察 fibs 函 数 ， 最 后 有 一 个 语句 return result， 意 思 是 将 变量 result 的 值 
返回 。 返 回 给 谁 呢 ? 一 般 这 类 函数 调用 的 时 候 ， 要 通过 类 似 lst=fibs 
(10) 的 语句 ， 那 么 返回 的 那个 值 束 被 变量 ]st 贴 上 了 ， 通 过]st 就 能 得 
到 该 值 。 如 果 没 有 这 个 赋值 语句 ， 虽 然 琅 数 照 样 返 回 值 ， 但 是 它 蒜 名 
I 中 ， 我 们 无 法 抓 出 来 ， 并 且 最 终 还 被 当 作 垃圾 被 Python 回收 


上 面 的 函数 只 返回 了 一 个 返回 值 (是 一 个 列表 ) ， 若 你 需要 返回 多 个 
也 是 可 以 的 ， 只 不 过 是 以 元 组 形式 返回 。 


>>> def my_fun(): 


有 的 画 数 没有 renturn 一 样 执行 完毕 ， 束 算 也 干 了 某 些 活 儿 吧 。 事 实 
上 ， 不 是 没有 返回 值 ， 只 不 过 是 None。 比 如 这 样 一 个 函数 : 


>>> def my_fun(): 


print "I am doing somthing." 


在 交互 模式 下 构造 一 个 很 简单 的 函数 ， 注 意 ， 这 是 构造 了 一 个 简单 画 
人 千 万 不 要 在 交互 模式 下 做 。 如 果 你 非 要 做 ， 
Nl = El 大 


这 个 函数 的 作用 束 是 打印 出 一 段 话 ， 即 执行 这 个 函数 就 能 打印 出 那 段 


话 ， 但 是 没有 return ° 


>> a = my_ fun() 


I am doing somthing. 


我 们 再 看 看 那个 变量 8， 到底 是 什么 。 


>>> print a 
None 


这 不是 只 干 活 儿 没 有 return 的 函数 ， 返 回 给 变量 的 是 一 个 None。 这 种 
模样 的 函数 通常 不 用 上 壕 方 式 调用 ， 而 采用 下 面 的 方式 ， 因 为 他 们 返 
回 的 是 None， 似 乎 这 个 返回 值 的 利用 价值 不 高 ， 所 以 不 用 找 一 个 变量 
来 接受 返回 值 了 。 


>>> my_fun() 


I am doing somthing. 


寺 别 注意 那个 return， 它 还 有 一 个 作用 。 观 察 下 面 的 钞 数 和 执行 结 采 ， 
看 看 能 不 能 发 现 它 的 男 外 一 个 作用 。 


看 出 玄机 了 吗 ? 在 函数 中 ， 本 来 有 两 个 print 语 句 ， 但 是 中 间 插 入 了 一 
个 return， 仪 仅 是 一 个 return。 当 执行 贸 数 的 时 候 ， 只 执行 了 第 一 个 
print 语 句 ， 第 二 个 并 没有 执行 。 这 是 因为 执行 第 一 个 语 名 之后， 过 到 
了 return， 它 告诉 函数 要 返回 ， 即 中 断 轴 数 体内 的 流程 ， 离 开 这 个 画 
数 ， 结 来 第 二 个 print 束 没有 被 执行 。 所 以 ，retum 在 这 里 就 有 了 一 个 作 
全 0 。 有 点 类 似 循环 中 的 break 的 作用 ， 仅 仅 是 类 
以 妥 了 。 


3.1.8” 玉 数 中 的 文档 
“程序 在 大 多 数 情况 下 是 给 人 看 的 ， 只 是 偶尔 被 机 器 执行 一 下 。” 


所 以 ， 写 程序 必须 要 写 注 释 。 有 人 宣称 ， 好 代码 是 不 需要 注释 的 。 对 
此 ， 我 表示 侈 同 ， 但 是 前 提 是 “好 代码 ”。 如 采写 不 出 “好 代码 ”， 十 不 


征 束 需要 注释 了 呢 ? 大 多 数 程序 员 ， 包 括 我 在 内 ， 都 不 能 保证 目 己 的 
代码 属于 人 见 人 爱 的 “好 代码 ”， 所 以 ， 注 释 是 必要 的 。 


前 面 已 经 有 过 说 明 ， 如 果 某 一 行 用 # 开 始 ，Python 就 不 执行 它 后 面 的 内 
容 (Python 看 不 到 它 ， 但 是 人 能 看 到 ) ， 则 这 人 一行 就 作为 注释 存在 。 


除了 这 样 的 一 句 之 外 ， 一 般 在 每 个 范 数 名 字 的 下 面 ， 还 要 写 一 写 文 
档 ， 以 此 来 说 明 这 个 函数 的 用 途 。 


#!/usr/bin/env python 


# coding=utf-8 


def fibs(n): 


This is a Fibonacci sequence. 


result = [9,1] 


for i in range(n-2): 


result.append(result[-2] + result[-1]) 


return result 


if name == "main__" 


lst = fibs(10) 


print lst 


在 这 个 函数 的 名 称 下 面 ， 用 三 个 引号 的 方式 ， 包 于 着 对 这 个 函数 的 说 
明 ， 即 函数 文档 。 


为 了 能 清晰 地 了 解 男 数 文档 ， 先 写 一 个 简单 的 画 数 例 于 。 


return x+y 


>>> dir(add) 


[6 二 SS " tlosure “i C0 7" defaults RE 7 7 dict “dd06 OP 
', '_get _', '_ getattribute ', '_ globals _', '_ hash_', '_init __', '_ module _', '_ name_', '__new. 六 reduc 
e. ， '—reduce ex _', '__repr. '__setattr__', '__ sizeof Ist '__subclasshook _', 'func_closure', 'func_c 
ode', 'func_defaults', 'func_dict', 'func_doc', 'func_globals', 'func_name'] 


请 读者 用 你 那 一 双 甘 眼 找 一 找 ， 有 没有 这 样 一 个 东西 doc ， 它 里 
面 束 记录 着 这 个 函数 的 文档 信息 。 


>>> print add._ doc _ 


None 


大 然 是 None， 这 没有 错 。 因 为 上 面 的 函数 根本 束 没 有 写 文档 内 容 ， 如 
打 不 是 None 那 才 是 有 问题 呢 。 
下 面 增加 点 儿 东 西 ， 束 是 函数 文档 。 


>>> def add(x, y): 


>>> print add. doc _ 


add x and y. 


这 显示 了 图 数 文 档 的 内 容 。 这 样 为 每 个 钞 数 都 做 了 一 个 简要 说 明 ， 让 

调用 这 个 函数 的 人 明日 画 数 的 作用 和 使 用 意图 ， 我 代表 男 外 一 个 你 不 

0 癌 勤劳 写 文档 的 你 表示 感谢 ， 因 为 你 的 勤劳 免 去 了 我 们 
"J 内 


3.2 名词 辨析 

在 图 数 中 ， 有 一 些 名 词 容 易 让 人 糊涂 ， 甚 至 常常 谈 起 ， 但 不 知道 其 舍 
义 ， 需 要 对 这 些 名 词 深究 一 番 。 

3.2.1 参数 和 变量 

参数 ， 是 貌似 比较 复杂 的 ， 所 以 要 深入 讨论 。 


在 程序 员 嘴 里 ， 你 或 许 听 说 过 “ 形 参 ”、“ 实 参 ”、“ 参 数 ” 等 名 词 ， 到 底 
指 什么 呢 ? 


在 定义 函数 的 时 候 《def 来 定义 函数 ， 称 为 def 语 句 ) ， 画 数 名 后 面 的 
括号 里 如 末 有 变量 ， 它 们 通 肖 被 称 为 “ 形 参 *。 调 用 函数 的 时 候 ， 给 函 
数 提供 的 值 叫 作 “ 实 参 ”"， 或 者 “参数 ”。 


其 实 ， 如 果 你 区 别 不 开 ， 也 不 会 耽误 你 写 代码 ， 这 只 不 过 类 似 孔 乙己 
先生 知道 苟 香 豆 的 苘 字 有 多 少 种 写法 罢了 。 但 是 ， 我 居然 硕 到 过 某 公 
司 面试 官 问 这 种 问题 。 


我 们 束 简 化 一 下 ， 觉 统 地 把 函数 括号 里 面 的 变量 叫 作 参数 吧 ， 当 然 ， 
你 叫 作 变 量 也 无 妨 ， 只 要 大 家 都 知道 指 的 是 什么 东西 就 好 了 。 虽 然 这 


样 说 会 引起 某 些 认真 的 人 来 喷 口 水 ， 但 不 用 担心 ， 反 正本 书 已 经 声明 
是 很 "水 "的 了 。 


但 如 采 有 人 较真 ， 非 要 让 你 区 分 ， 为 了 显示 你 的 水 平 ， 你 可 以 引用 微 
软 网 站 上 的 说 明 。 我 认为 这 段 说 明 高 度 抽象 ， 而 且 意 义 涵盖 深远 。 摘 
抄 过 来 ， 请 读 一 读 ， 看 看 吓 否 理解 。 


参数 和 变量 之 间 的 差异 (Visual Basic) 


多 数 情况 下 ， 过 程 必须 包含 有 关 调 用 环境 的 一 些 信息 。 执行 重复 或 共 
译 任务 的 过 程 对 每 次 调用 使 用 不 同 的 信息 。 此 信息 包公 每 次 调用 过 程 
时 传递 给 它 的 变量 、 篆 量 和 表达 式 。 


铬 要 将 此 信息 传递 给 过 程 ， 过 程 先 要 定义 一 个 形 参 ， 然 后 调用 代码 将 
一 个 实 参 传递 给 所 定义 的 形 参 。 您 可 以 将 形 参 当 作 一 个 停车 位 ， 而 将 
实 参 当 作 一 辆 汽车 。 束 像 一 个 集 车 位 可 以 在 不 同时 间 集 放 不 同 的 汽车 
一 样 ， 调 用 代码 在 每 次 调用 过 程 时 可 以 将 不 同 的 实 参 传递 给 同一 个 形 


参 。 


形 参 表示 一 个 值 ， 过 程 希望 您 在 调用 它 时 传递 该 值 。 

当 您 定义 Function 或 sub 过程 时 ， 需 要 在 紧 跟 过 程 名 称 的 括号 内 指定 形 

参 列 表 。 对 于 每 个 形 参 ， 您 可 以 指定 名 称 、 数 据 类 型 和 传 入 机 制 
(ByVal (Visual Basic) 或 ByRef (Visual Basic) ) 。 您 还 可 以 指示 某 

个 形 参 是 可 选 的 。 这 意味 着 调用 代码 不 必 传 递 它 的 值 。 

每 个 形 参 的 名 称 均 可 作为 过 程 内 的 局 部 变量 。 形 参 名 称 的 使 用 方法 与 

其 他 任何 变量 的 使 用 方法 相同 。 

实 参 表示 在 您 调用 过 程 时 传递 给 过 程 形 参 的 值 。 调 用 代码 在 调用 过 程 

时 提供 参数 。 

调用 Function 或 Sub 过 程 时 ， 需 要 在 紧 跟 过 程 名 称 的 括号 内 包括 实 参 列 

表 。 每 个 实 参 均 与 此 列表 中 位 于 相同 位 置 的 那个 形 参 相对 应 。 


与 形 参 定义 不 同 ， 实 参 没有 名 称 。 每 个 实 参 就 是 一 个 表达 式 ， 它 包含 
零 或 多 个 变量 、 常 数 和 文本 。 求 值 的 表达 式 的 数据 类 型 通常 应 与 为 相 


应 形 参 定义 的 数据 类 型 相 匹配 ， 并 且 在 任何 情况 下 ， 该 表达 式 值 都 必 
须 可 转换 为 此 形 参 类 型 。 


看 完 这 段 引 文 会 发 现 里 面 有 几 个 关键 词 : 参数 、 变 量 、 形 参 、 实 参 。 
本 来 想 弄 清楚 参数 和 变量 ， 结 采 叉 冒 出 男 外 两 个 词 ， 更 混乱 了 。 请 少 
安 地 躁 ， 在 编程 业界 ， 类 似 的 东西 有 很 多 名 词 。 下 次 听 到 有 人 说 这 些 
束 不 用 害怕 啦 ， 反 正 目 己 昕 过 了 。 

在 Python 中 ， 没 有 这 么 复杂 。 


ee 


>>> def add(x) : #X 是 参数 ， 准 确 说 是 形 参 
a= 10 #a 是 变量 
return a + X #x 就 是 那个 形 参 作为 变量 ， 其 本 质 是 要 传递 赋 给 这 个 画 数 的 值 
SX 二 #x 是 变量 ， 只 不 过 在 函数 之 外 
>>> add(x) # 这 里 的 x 是 参数 ， 但 是 它 由 前 面 的 变量 x 传递 对 象 3 
13 
>>> add(3) # 把 上 面 的 过 程 合并 了 


13 


至 此 ， 读 者 十 否 清 楚 了 一 点 点 。 其 实 没 有 那么 复杂 。 关 键 要 理解 画 数 
名 括号 后 面 的 东西 的 作用 是 传递 值 。 


3.2.2 ”全 局 变量 和 局 部 变量 


虽然 是 讲 参 数 ， 但 是 天 于 全 局 变量 和 局 部 变量 的 区 别 也 要 先 弄 清楚 ， 
因为 关系 到 函数 内 外 有 别 的 大 事 。 


下 面 这 上段 代码 中 有 一 个 函数 funcx()， 这 个 函数 里 面 有 一 个 变量 x=9， 在 
函数 的 前 面 也 有 一 个 变量 x=2 。 


print "this x is in the funcx:-->", x 


print "this x is out of funcx:-->", x 
那么 ， 这 段 代码 输出 的 结果 是 什么 呢 ? 看 ; 
this x is in the funcx:--> 9 


从 输出 看 由 ， 运 行 funcx0， 输 出 了 funcx0 里 面 的 变量 x=9;， 然后 执行 代 
码 中 的 最 后 一 行 ， print"this x is out of funcx:-->",，X 


要 特别 关注 的 是 ， 前 一 个 x 输出 的 是 函数 内 部 的 变量 x;， 后 一 个 x 输出 的 
是 函数 外 面 的 变量 x。 两 个 变量 彼此 没有 互相 影响 ， 虽 然 都 是 zx。 从 这 
里 看 出 ， 两 个 x 各 目 在 各 目的 领域 内 起 到 作用 。 

把 那个 只 在 函数 体内 〈 某 个 范围 内 ) 起 作用 的 变量 称 之 为 局 部 变量 。 


有 局 部 束 有 对 应 的 全 部 ， 感 觉 很 别扭 ， 局 部 对 应 的 是 全 局 ， 不 征 全 
部 ， 所 以 又 来 了 一 个 名 词 : 全 局 变量 。 


global x # 跟 上 面 函 数 的 不 同 之 处 


以 上 两 段 代码 的 不 同 之 处 在 于 ， 后 者 在 函数 内 多 了 一 个 global x， 这 句 
话 的 意思 是 在 声明 x 是 全 局 变量 ， 也 束 是 说 这 个 x 跟 函 数 外 面 的 那个 x 是 
9 


this x is in the funcx:--> 9 


好 似 全 局 变量 能 力 很 强悍 ， 能 够 统帅 函数 内 外 。 但 是 ， 要 注意 ， 这 个 
人 
一 定 要 注意 。 


3.2.3 ”命名 空间 


命名 空间 是 一 个 比较 不 容易 理解 的 概念 ， 竺 别 是 对 于 初学 者 而 言 ， 似 
平 它 很 绎 比 。 我 在 维基 百科 中 看 到 对 它 的 定义 ， 不 仅 定 义 比较 好 ， 连 
里 面 的 例子 都 不 错 。 所 以 ， 抄 隶 下 来 ， 帮助 读者 理解 这 个 名 词 。 


命名 空间 (英语 : Namespace) 表示 标识 符 (identifier) 的 可 见 范 围 。 
一 个 标识 从 可 在 多 个 命名 空间 中 定义 ， 它 在 不 同 命名 空间 中 的 含义 是 
互 不 相干 的 。 在 一 个 新 的 命名 空间 中 可 定义 任何 标识 从 ， 它 们 不 会 
I 因为 已 有 的 定义 都 处 于 其 他 命名 空间 


例如 ， 设 B 记 是 X 公 司 的 员工 ， 工 号 为 123， 而 John 是 Y 公 司 的 员工 ， 工 

号 也 是 123。 由 于 两 人 在 不 同 的 公司 工作 ， 可 以 使 用 相同 的 工 号 来 标识 

而 不 会 造成 混乱 ， 这 里 每 个 公司 就 表示 一 个 独立 的 命名 空间 。 如 果 两 

0 
混乱 。 


这 一 特点 是 使 用 命名 空间 的 主要 理由 。 在 大 型 的 计算 机 程序 或 文档 
中 ， 往 往 会 出 现 数 百 或 数 千 个 标识 符 。 命 名 空间 提供 一 隐藏 区 域 标识 
符 的 机 制 。 通 过 将 逻辑 上 相关 的 标识 符 组 织 成 相应 的 命名 空间 ， 可 使 
整个 系统 更 加 模块 化 。 


在 编程 语言 中 ， 命 名 空间 是 对 作用 域 的 一 种 特殊 的 抽象 ， 它 包含 了 处 
于 该 作用 域内 的 标识 符 ， 且 本 身 也 用 一 个 标识 符 来 表示 ， 这 样 便 将 一 
系列 在 逻辑 上 相关 的 标识 符 用 一 个 标识 符 组 织 了 起 来 。 许 多 现代 编程 
语言 都 文 持 命 名 空间 。 在 一 些 编程 语言 〈 例 如 C++ 和 Python) 中 ， 命 
名 空间 本 里 的 标识 符 也 属于 一 个 外 层 的 命名 空间 ， 有 即 命名 空间 可 以 赂 
套 ， 构 成 一 个 命名 空间 树 ， 树 根 则 是 无 名 的 全 局 命名 空间 。 


玉 数 和 类 的 作用 域 可 被 视 作 隐 式 命名 空间 ， 它 们 和 可 见 性 、 可 访问 性 
和 对 象 生命 周期 不 可 分 割地 联系 在 一 起 。 


显然 ， 用 “命名 空间 ”或 者 “作用 域 ” 这 样 的 名 词 ， 束 是 因为 有 了 函数 
(后 面 还 会 有 类 ) 之 后 ， 在 函数 内 外 都 可 能 有 外 形 一 样 的 符号 (标识 
守 ) ， 在 Python 中 〈 乃 至 于 其 他 高 级 语言 ) ， 为 了 区 分 此 变量 非 彼 变 
(虽然 外 形 一 样 ) ， 需 要 用 这 样 的 东西 来 框 定 每 个 变量 所 对 应 的 值 
发 生 作 用 的 范围 ) 。 


一 熙 < 


前 面 已 经 讲 过 ， 变 量 和 对 象 (就 是 所 变量 所 对 应 的 值 ) 之 间 的 关系 
是: 变量 类 似 标签 ， 贴 在 了 对 象 上 ， 即 通过 赋值 语句 实现 了 一 个 变量 
标签 对 应 一 个 数据 对 象 《 值 ) ， 这 种 对 应 关系 让 你 想起 了 什么 ? 映 
射 ! Python 中 唯一 的 映射 惑 是 字典 ， 里 面 有 " 键 / 值 对 ”。 变量 和 值 的 头 
系 束 有 点 像 “ 键 "和 “ 值 ”* 的 关系。 有 一 个 内 建 钞 数 vars， 可 以 帮助 我 们 研 
客 一 下 这 种 对 应 关系 。 


既然 如 此 ， 诚 如 前 面 的 全 局 变量 和 局 部 变量 ， 即 使 是 同样 一 个 变量 名 
称 ， 但 是 它 在 不 同 范围 (用 “命名 空间 ”更 专业 ) 对 应 不 同 的 值 。 


3.3 ”参数 收集 


在 函数 中 ， 参 数 的 个 数 有 时 候 是 一 个 ， 比 如 一 个 用 来 计算 圆 面积 的 函 
数 ， 它 所 需要 的 参数 就 是 半径 (mr^2) ， 这 个 函数 的 参数 是 确定 的 。 


然而 ， 这 个 世界 不 总 和 是 这 么 简单 的 ， 有 时 候 参数 个 数 是 多 个 ， 甚 至 不 
征 确 定 的 ， 不 确定 性 或 许 更 是 钊 人 态 。 如 有 果 读 者 了 解 量子 力学 咕 更 理解 
真正 的 不 确定 性 了 。 当 然 ， 不 用 研究 量子 力学 也 一 样 能 够 体会 到 ， 世 
是 。 也 惑 是 说 ， 我 们 还 要 解决 画 数 的 参数 个 数 不 确 
定 的 情况 。 


3.3.1 ”参数 收集 


Python 用 这 样 的 方式 解决 参数 个 数 的 不 确定 性 : 


print func(1, 2, 3, 4, 5, 6, 7, 8, 9) # 赋 给 函数 的 参数 个 数 不 仅 仅 是 2 个 


运行 此 代码 后 ， 得 到 如 下 结 
站 # 这 是 第 一 个 print， 参 数 x 得 到 的 值 是 1 


(2，3，4，5，6，7，8，9)# 这 是 第 二 个 print， 参 数 arg 得 到 的 是 一 个 元 组 


45 # 最 后 的 计算 结果 


从 上 面 例 子 可 以 看 出 ， 如 果 输 入 的 参数 个 数 不 确定 ， 其 他 参数 全 部 通 
过 *arg， 以 元 组 的 形式 由 arg 收 集 起 来 。 对 照 上 面 的 例子 不 难 发 现 : 

。 值 1 传 给 了 参数 x。 

。 值 2、3、4、5、6、7、8、9 被 塞 和 一 个 tuple 里 面 ， 传 给 了 arg。 
为 了 能 够 更 明显 地 看 出 arg (名 称 可 以 不 一 样 ， 但 是 符号 * 必 须要 
有 ) ， 可 以 用 下 面 的 一 个 简单 画 数 来 演示 : 


>>> def foo(*args): 


print args # 打 印 通 过 这 个 参数 得 到 的 对 象 


下 面 演示 分 别传 入 不 同 的 值 ， 通 过 参数 *args 得 到 的 结 采 : 


> POO0tL 2 


(1, 2, 3) 

>>> foo("qiwsir", "qiwsir.github.io", "python") 

('qiwsir', "qiwsir.github.io'， 'python') 

>>> foo("qiwsir", 307, ["qiwsir",2], {"name":"qiwsir", "lang":"python"}) 


('qiwsir', 307, ['gqiwsir', 2], {'lang': 'python', 'name': 'qiwsir'}) 


不 管 是 什么 ， 都 一 股 脑 地 塞 进 了 tuple 中 。 


>>> foo("python") 


('python', ) 


即使 只 有 一 个 值 ， 也 是 用 tuple 收 集 它 。 特 别 注意 ， 在 tuple 中 ， 如 果 只 
有 一 个 元 素 ， 后 面 要 有 一 个 逗号 。 
还 有 一 种 可 能 ， 就 是 不 给 那个 *args 传 值 ， 这 也 是 许可 的 。 例 如 : 

>>> def foo(x, *args): 

>>> foo(7) 


XK 下 


tuple: () 


这 时 候 *args 收 集 到 的 是 一 个 空 的 tuple。 


在 各 类 编程 语言 中 ， 常 
年 


管 是 对 变量 、 画 数 还 


自 维基 百科 的 解释 。 


在 计算 机 程序 设计 与 计算 机 技术 的 相关 文档 中 ， 术 语 foobar 是 一 个 常 
见 的 无 名 开化 名 ， 常 被 作为 “ 伪 变 量 ” 使 用 。 


从 技术 上 讲 , “foobar” 很 可 能 在 20 世 纪 60 年 代 至 70 年 代 初 通过 迪 吉 多 的 
系统 手册 传播 开 来 。 另 一 种 说 法 是 , “foobar” 可 能 来 源 于 电子 学 中 反 转 


会 遇 到 以 foo、bar、foobar 等 之 类 的 命名 ， 不 
面 要 


名 
后 面 要 讲 到 的 类 。 这 征 什 么 意思 呢 ? 下 面 征 来 


的 foo 信 号 ;这 是 因为 如 果 一 个 数字 信和 号 是 低 电 平 有 效 〈 即 负 压 或 零 电 
压 代表 “1”) ， 那 么 在 信号 标记 上 方 一 般 会 标 有 一 根 水 平 横 线 ， 而 横 线 
的 英文 即 为 "bar”。 在 《新 墨客 辞典 》 中 ， 还 提 到 “foo” 可 能 

于 “FUBAR” 出 现 。 


单词 “foobar” 或 分 离 的 “foo” 与 “bar”* 常 出 现 于 程序 设计 的 案例 中 ， 如 同 
Hello World 程 序 一 样 ， 它 们 常 被 用 于 同学 习 者 介绍 某 种 程序 语 
言 。“foo” 常 被 作为 函数 方法 的 名 称 ， 而 “bar”* 则 常 被 用 作 变 量 名 。 


除了 用 args 这 种 形式 的 参数 接收 多 个 值 之 外 ， 还 可 以 用 “*#*kargs” 的 形 
式 接 收 数值 ， 不 过 这 次 有 点 不 一 样 : 


>>> def foo(**kargs) : 


print kargs 


>>> foo(a=1, b=2, c=3) # 注 意 观察 这 次 赋值 的 方式 和 打印 的 结果 


证 


如 果 这 次 还 用 foo (1，2，3) 的 方式 ， 会 有 什么 结果 呢 ? 


>>> foo(1, 2, 3) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: foo() takes exactly 0 arguments (3 given) 


如 采用 **kargs 的 形式 收集 值 ， 会 得 到 字典 类 型 的 数据 ， 但 是 ， 需 要 在 
Sa 时 候 说 明 “ 键 ?和 * 值 >， 因为 在 字典 中 是 以 “ 键 值 ? 对 形式 出 现 


把 上 面 的 几 种 情况 综合 起 来 ， 看 看 有 什么 效果 。 


>>> def foo(x, y, z, *args, **kargs): 


print x 
print y 
print z 
print args 


print kargs 


>>> foo('qiwsir', 2, "python") 
qiwsir 

2 

python 

() 


>> foo(1, 2, 3, 4; 5) 


(4, 5) 


>> foo(1, 2, 3, 4, 5, name="qiwsir") 


这 样 就 能 够 足以 应 付 各 种 各 样 的 参数 要 求 了 。 
3.3.2 ”更 优雅 的 方式 


>>> def add(x, y): 


return x+y 


>>> add(2,3) 


5 


这 是 通常 的 范 数 调用 方法 ， 在 前 面 已 经 屡次 用 到 。 这 种 方法 简单 明 
快 ， 很 容易 理解 。 但 是 ， 世 界 总 是 多 样 性 的 ， 甚 至 在 某 种 情况 下 你 秀 
出 下 面 的 方式 可 能 更 优雅 。 


>>> add(*bars) 


5 


先 把 要 传 的 值 放 到 元 组 中 ， 赋 值 给 一 个 变量 bars， 然 后 用 add (*bars) 
的 方式 ， 把 值 传 到 函数 内 ， 这 有 点 像 前 面 收集 参数 的 逆 过 程 。 注 意 ， 
元 组 中 元 素 的 个 数 要 跟 函 数 所 要 求 的 变量 个 数 一 怪 。 如 果 这 样 : 


>>> bars = (2, 3, 4) 


>>> add(*bars) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: add() takes exactly 2 arguments (3 given) 


就 报错 了 。 


这 是 使 用 一 个 星 号 *， 以 元 组 形式 传 值 ， 如 有 果 用 ** 的 方式 ， 是 不 是 应 该 
以 字典 的 形式 传 值 呢 ? 理 当 如 此 。 


>>> def book(author, name): 
print "%s is writing %s" % (author, name) 


>>> bars = {"name":"Starter learning Python", "author":"Kivi"} 


>>> book(**bars) 


Kivi is writing Starter learning Python 


这 种 调用 函数 传 值 的 方式 很 少 用 到 ， 人 至 少 在 我 的 编程 实践 中 用 得 不 
多 ， 但 不 代表 读者 不 用 ， 这 或 许 是 习惯 问题 。 


3.3.3 ”综合 贯通 
Python 中 函数 的 参数 通过 赋值 的 方式 来 传递 引用 对 象 。 下 面 总 结 常 见 
的 函数 参数 定义 方式 ， 来 理解 参数 传递 的 流程 。 


def foo(pt, Pp2; D9 22) 


这 种 方式 最 常见 了 ， 列 出 有 限 个 数 的 参数 ， 并 且 彼 此 之 间 用 去 号 隔 
开 。 在 调用 函数 的 时 候 ， 按 照 顺序 对 参数 进行 上 赋值， 特别 要 注意 的 
征 ， 参 数 的 名 字 不 重要 ， 重 要 的 是 位 置 。 而 且 ， 必 须 数量 一 致 ， 一 一 
对 应 。 第 一 个 对 象 〈 可 能 是 数值 、 字 符 串 等 ) 对 应 第 一 个 参数 ， 第 二 
个 对 象 对 应 第 二 个 参数 ， 如 此 对 应 ， 不 得 偏 左 也 不 得 偏 右 。 


> def foo(pl;: p2;. p3): 
print "pi==>",p1 
print "p2==>",p2 


print "p3==>",p3 


fool"python’; 1 ["qilweir" "githyub", "io"]s 
p1==> python 


p2==> 1 


p3==> ['qiwsir', 'github', 'io'] 


>>> foo("python") 
Traceback (most recent call last): 


line 1, in <module> 


File "<stdin>" 
# 注 意 看 报错 信息 


TypeError: foo() takes exactly 3 arguments (1 given) 


Ss Foo{f "python LT; 这 i 3 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


TypeError: foo() takes exactly 3 arguments (4 given) 


def foo(p1=value1，p2=value2,...) 


这 种 方式 要 求 把 参数 和 值 部 写 上 ， 貌 似 这 样 束 不 乱 了 ， 很 明确 是， 碳 
有 一 个 梦 卜 对 看 一 个 坑 的 意味 。 


还 以 前 面 的 函数 为 例 ， 用 下 面 的 方式 赋值 吕 不 用 担心 顺序 问题 了 。 


>>> foo(p3=3, p1i=10, p2=222) 
pi==> 10 
p2==> 222 


p3==> 3 


还 可 以 用 类 似 下 面 的 方式 ， 部 分 参数 给 予 默 认 的 值 。 


>>> def foo(p1, p2=22, p3=33): # 设 置 了 两 个 参数 p2， p3 的 默认 值 
print "pi==>", pi 
print "p2==>", p2 


print "p3==>", p3 


>>> foo(11) #p1=11， 其 他 的 参数 为 默认 赋值 


p1==> 11 
p2==> 22 


p3==> 33 


>>> foo(11, 222) # 按 照 顺 序 ，p2=222，p3 依 旧 维 持原 默认 值 
pi==> 11 

p2==> 222 

p3==> 33 

>>> foo(11, 222, 333) 

p1==> 11 

p2==> 222 


p3==> 333 


>>> foo(11, p2=122) 


pi==> 11 
p2==> 122 
p3==> 33 
>>> foo(p2=122) #p1 没 有 默认 值 ， 必 须要 赋值 的 ， 否 则 报错 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: foo() takes at least 1 argument (1 given) 


def foo(*args) 


Re 候 ， 在 参数 args 前 面 加 一 个 *， 注 
局 ;， 仅 加 一 个” 


>>> def foo(*args): 


print args 


>>> foo("qiwsir.github.io") 
(Cuinsir. .qithub,io0', } 
>>> foo("qiwsir.github.io","python") 


('qiwsir.github.io', 'python') 


def foo(**args) 


这 种 方式 跟 上 面 的 区 别 在 于 ， 必 须 接收 类 似 arg=val 的 形式 。 


>>> def foo(**args): 


print args 


>>> foo(1, 2, 3) # 这 样 就 报错 了 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: foo() takes exactly 0 arguments (3 given) 


>>> foo(a=1, b=2, c=3) 


{'a': 1, 'c': 3, 'b': 2} 


下 面 写 一 个 综合 的 ， 看 看 以 上 四 种 参数 传递 方法 的 执行 顺序 。 


>>> def foo(x,y=2, *targs, **dargs): 
print "x==>", x 
print "y==>", y 
print "targs_tuple==>", targs 


print "dargs_dict==>", dargs 


>>> foo("1x") 
X==> ‘1x 

y==> 2 
targs_tuple==> () 


dargs_dict==> {} 


>>> foo("1x", "2y") 


X==> 1X 


targs_tuple==> () 


dargs_dict==> {} 


>>> foo("1ix", "2y", "3t1", "3t2") 


targs tuple==> ("3t1'; '3t2"') 


dargs_dict==> {} 


>>> foo("1x", "2y", "3t1", "3t2", di="4d1", d2="4d2") 


targs_ tuple==> ('3t1’, ‘3t2") 


dargs_dict==> {'d2': '4d2', 'd1i': '4d1'} 


3.4 ”特殊 函数 

到 目前 为 止 ， 你 已 经 知道 怎么 写 一 个 函数 了 。 但 是 ， 从 “知道 ”到 “做 
在 Python 中 ， 除 了 目 己 写 函 数 之 外 ， 它 还 提供 了 一 些 特有 的 函数 ， 比 
如 前 面 已 经 多 次 出 现 的 内 建 画 数 ， 还 有 某 些 模块 中 的 函数 等 ， 但 是 ， 
看 了 这 里 要 说 的 特殊 函数 之 后 ， 你 的 确 会 感受 到 它们 的 不 一 样 ， 它 们 
常常 被 认为 是 “函数 式 编程 ”的 代表 。 

3.4.1 递归 


递归 不 是 画 数 ， 而 是 一 种 思想 。 之 所 以 放 到 这 里 是 因为 在 函数 中 要 用 
到 ， 所 以 先行 说 明 此 思想 ， 然 后 讲述 几 个 特殊 函数 。 


什么 是 递归 ? 
递归 ， 见 递归 。 
这 是 对 “递归 ”最 精简 的 定义 。 还 可 以 用 男 外 一 种 形式 定义 : 


从 前 有 座 山 ， 山 里 有 座 庙 ， 庙 里 有 个 老 和 尚 ， 正 在 给 小 和 疝 讲 故事 。 
故事 是 什么 呢 ? 从 前 有 座 山 ， 山 里 有 座 庙 ， 庙 里 有 个 老 和 尚 ， 正 在 给 


小 和 疝 讲 故事 。 故 事 和 是 什么 呢 ? 从 前 有 座 山 ， 山 里 有 座 庙 ， 庙 里 有 个 
老 和 尚 ， 正 在 给 小 和 疝 讲 故事 。 故 事 是 什么 呢 ? .……. 


如 果 用 上 面 的 内 容 做 递归 的 定义 ， 总 感觉 有 点 调 修 ， 来 个 严肃 的 〈 选 
自 维基 百科 ) : 


递归 (英语 : Recursion) ， 又 译 为 递 回 ， 在 数学 与 计算 机 科学 中 ， 是 
指 在 函数 的 定义 中 使 用 函数 自身 的 方法 。 


最 典型 的 递归 例子 之 一 是 裴 波 那 奖 数列 。 
辈 波 那 契 数列 的 定义 ， 可 以 直接 写成 这 样 的 辈 波 那 契 数列 递归 画 


#!/usr/bin/env python 


# coding=utf-8 


return fib(n-1) + fib(n-2) 


if name 


f = fib(10) 


print f 


把 上 述 代码 保存 。 这 个 代码 的 意 岁 是 要 得 到 n=10 的 值 。 运 行 之 : 


$ python 20401.py 


55 


fib (n-1) +fib (n-2) 就 是 又 调用 了 这 个 函数 目 己 ， 实 现 递归 。 为 了 明 
下 面 走 一 个 计算 过 程 〈 考 虑 到 次 数 不 能 太 多 ， 束 让 
n=3) 。 


1.n=3，fib (3) ， 自 然 要 走 return fib (3-1) +fib (3-2) 分 支 。 


(3-1) ， 即 fib (2) 也 要 走 else 分 支 ， 于 是 计算 fib (2-1) +fib 
2 


3.fib (2-1) 即 fib (1) ， 在 函数 中 就 要 走 elif 分 支 ， 返回 1， 即 fib (2- 
1) =1。 同 理 ， 容 易 得 到 fib (2-2) =0。 将 这 两 个 值 返回 到 上 面 一 步 。 
得 到 fib (3-1) =1+0=1。 


4. 再 计算 fib (3-2) ， 就 简单 了 一 些 ， 返 回 的 值 是 1， 即 fib (3-2) =1。 


5. 最 后 计算 第 一 步 中 的 结果 : fib (3-1) +fib (3-2) =1+1=2， 将 计算 结 
果 2 作 为 返回 值 。 


从 而 得 到 fib (3) 的 结果 是 2。 


从 上 面 的 过 程 中 可 以 看 出 ， 每 个 递归 的 过 程 都 是 向 着 最 初 的 已 知 条 件 
a0=0 和 a1l=1 方 癌 插 进一步， 直到 通过 这 个 最 的 层 的 条 件 得 到 结果 ， 然 
后 再 一 层 一 层 同 上 回馈 计算 结 


其 实 ， 上 面 的 代码 有 一 个 问题 。 因 为 ao=0、al=1 是 已 知 的 了 ， 不 需要 
每 次 都 判断 一 边 。 所 以 ， 还 可 以 优化 一 下 ， 优 化 的 基本 方案 束 是 初始 
化 最 初 的 两 个 值 。 


#!/usr/bin/env python 


# coding=utf-8 
meno = {0:0, 1:1} # 初 始 化 
def fib(n): 
if not n in meno: 
meno[n] = fib(n-1) + fib(n-2) 


return meno[n] 


Af name. 


f = fib(10) 
print f 

# 运 行 结 果 

$ python 20402.py 


55 


以 上 实现 了 递归 ， 但是， 至 少 在 Python 中 ， 弟 归 要 慎重 使 用 。 因 为 在 
一 般 情 况 下 ， 递 归 是 能 够 被 迭代 或 者 循环 替代 的 ， 而 且 后 着 的 效率 种 
常 比 递归 要 高 。 所 以 ， 我 的 个 人 建议 是 ， 对 使 用 递归 要 考虑 周密 ， 不 


小 心 束 会 永远 运行 下 去 。 


3.4.2“” 几 个 特殊 函数 
特殊 函数 的 特殊 在 于 跟 “ 范 数 式 编程 ”* 扯 上 了 关系 。 


如 果 以 前 没有 听 过 ， 等 你 开始 进入 编程 界 ， 也 会 经 常 听 人 说 < 画 数 式 编 
程 ”、“ 面 向 对 象 编程 ”、“ 指 令 式 编程 "等 术语 。 它 们 是 什么 呢 ? 这 个 话 
题 要 从 “编程 范式 * 讲 起 。 (以 下 内 容 源 自 维基 百科 


编程 范 型 或 编程 范式 (英语 : Programming paradigm 范 即 模范 之 意 ， 范 
式 即 模式 、 方 法 ) ， 是 一 类 典型 的 编程 风格 ， 是 指 从 事 软件 工程 的 一 
类 典型 的 风格 (可 以 对 照 方 法 学 ) 。 如 : 男 数 式 编 程 、 程 序 编程 、 面 
各 对 象 编程 、 指 令 式 编程 等 为 不 同 的 编程 犯 型。 


编程 范 型 提供 了 (同时 决定 了 ) 程序 员 对 程序 执行 的 看 法 。 例 如 ， 在 
面 问 对 象 编程 中 ， 程 序 员 认 为 程序 是 一 系列 相互 作用 的 对 象 ， 而 在 画 
数 式 编程 中 一 个 程序 会 被 看 作 是 一 个 无 状态 的 函数 计算 的 吝 行 。 


正如 软件 工程 中 不 同 的 群体 会 提倡 不 同 的 * 方 法学” 一样， 不同 的 编程 
语言 也 会 提倡 不 同 的 “编程 范 型 ”。 一 些 语言 是 专门 为 某 个 特定 的 范 型 
设计 的 〈 如 Smalltalk 和 Java 文 持 面 加 对象 编 程 ， 而 Haskell 和 Scheme 则 | 
文 持 函 数 式 编程 ) ， 同 时 还 有 另外 一 些 语言 文 持 多 种 范 型 《如 Ruby、 
Common Lisp、Python 和 Oz) 。 


编程 范 型 和 编程 语言 之 间 的 关系 十 分 复杂 ， 由 于 一 个 编程 语言 可 以 文 
持 多 种 范 型 。 例 如 ，C++ 设 计时 ， 文 持 过 程 化 编程 、 面 向 对 象 编程 以 
及 泛 型 编程 。 然 而 ， 设 计 师 和 程序 员 们 要 考虑 如 何 使 用 这 些 范 型 元 又 
来 构建 一 个 程序 。 一 个 人 可 以 用 C++ 写 出 一 个 完全 过 程 化 的 程序 ， 另 
一 个 人 也 可 以 用 C++ 写 出 一 个 纯粹 的 面 辣 对 象 程序 ， 甚 至 还 有 人 可 以 
写 出 杂 炊 了 两 种 范 型 的 程序 。 


建议 读者 将 上 面 这 上 段 话 认真 读 完 ， 不 管 是 理解 还 是 不 理解 ， 总 能 有 点 


感觉 的 。 


正如 前 面 引 文中 所 说 的 ，Python 坪 文 持 多 种 范 型 的 语言 ， 可 以 进行 所 
谓 的 函数 式 编 程 ， 其 突出 体现 在 有 这 么 几 个 函 数 : 


filter ~、 map 、 reduce 、 lambda 、 yield 


有 了 它们 ， 最 大 的 好 处 是 程序 更 简洁 ， 没 有 它们 ， 程 序 也 可 以 用 别 的 
方式 实现 ， 只 不 过 可 能 要 多 写 几 行星 了 。 所 以 ， 还 是 能 用 则 用 之 吧 。 
更 何况 ， 恰 当地 使 用 这 几 个 画 数 ， 能 让 别人 感觉 你 更 牛 。 ( 注 ， 本 节 
不 对 yield 进 行 介绍 ， 后 面 介绍 。) 


1.lambda 


lambda 芳 数 是 一 个 只 用 一 行 束 能 解决 问题 的 函数 ， 听 看 钙 多 么 诱 人 
呀 。 看 下 面 的 例子 : 


>>> def add(x) : 


X 4+= 3 


return X 


numbers = range(10) 
numbers 
[9, 1, 2, 3, 4, 5, 6, 7, 8, 9] 
>>> new_numbers = [] 
>>> for i in numbers: 


new_numbers.append(add(i)) # 调 用 add( ) 函 数 ， 并 append 到 1ist 中 


>>> new_numbers 


[37 47 5; 6, 77 8 9; 10, 11; 了 2] 


在 这 个 例子 中 ，addO 只 苹 一 个 中 间 操 a 作 。 当 然 ， 上 面 的 例子 完全 可 以 
用 别 的 方式 实现 。 比 如 : 


> new_numbers = [ i+3 for i in numbers ] 


> new_numbers 


[3, 4, 5, 6, 7, 8, 9, 10, 11, 12] 


首先 说 明 ， 这 种 列表 解析 的 方式 是 非常 好 的 。 


但 是 ， 我 们 偏偏 要 用 lambda 这 个 函数 替代 add (x) ， 如 果 你 和 我 一 样 
这 么 偏执 ， 束 可 以 : 


>>> lam = lambda x: x+ 3 
>> n2 = [] 
>>> for i in numbers: 


n2.append(lam(i)) 


[3, 4, 5, 6, 7, 8, 9, 10, 11, 12] 


这 里 的 lam 就 相当 于 add (x) ， 请 对 应 一 行 lambda x:x+3 就 完 
成 add (x) 的 三 行 ， 特别 是 最 后 返回 值 。 还 可 以 写 这 样 的 例子 : 


>>> g = lambda x,y:x+y 
>> g(3,4) 

7 

>>> (lambda x:x**2)(4) 


16 


通过 上 面 的 例子 ， 总 结 一 下 lambda 范 数 的 使 用 方法 : 
。 在 lambda 后 面 直 接 跟 变量 。 
加 变量 后 面 是 冒号 二 
。 冒号 后 面 是 表达 式 ， 表 达 式 计算 结果 就 是 本 函数 的 返回 值 。 


为 了 人 箭 明 扼 要 ， 用 一 个 式 子 表示 是 必要 的 : 


lambda arg1，arg2，...argN : expression using arguments 


要 特别 提醒 读者 : 虽然 lambda 函 数 可 以 接收 任意 多 个 参数 (包括 可 选 
参数 ) 并 且 返 回 单个 表达 式 的 值 ， 但 是 lambda 函 数 不 能 包含 命令 ， 包 
含 的 表达 式 不 能 超过 一 个 。 不 要 试图 同 ljambda 函 数 中 塞 入 太 多 的 东 
OG 应 该 定义 一 个 普通 函数 ， 想 让 它 多 长 
天 多 长 。 


束 lambda 而 言 ， 它 并 没有 给 程序 市 来 性 能 上 的 提升 ， 但 市 来 的 是 代码 
的 人 简洁。 比如， 要 打印 一 个 list， 里 面 依次 是 某 个 数字 的 1 次 方 、 二 次 
方 、 三 次 方 、 四 次 方 。 用 lambda 可 以 这 样 做 : 


>>> lamb = [ lambda x:x, lambda x:x**2, lambda x:x**3, lambda x:x**4 ] 


>>> for i in lamb: 


print i(3), 


39 27 81 


lambda 作 为 一 个 单行 的 函数 ， 在 编程 实践 中 可 以 选择 使 用 。 


2.map 


先 看 一 个 例子 ， 还 是 上 面 讲述 lambda 时 的 第 一 个 例子 ， 用 map 也 能 够 
实现 : 


>>> numbers 


[9, 


1, 2, 3, 4, 5, 6, 7, 8, 9] 


>>> map(add, numbers) # 只 引用 函数 名 称 add 即 可 


[3, 


47 55) “67 77. 48 "07. 10; 117 512] 


>>> map(lambda x: x+3，numbers)  ”# 用 lambda 当 然 可 以 啦 


[3， 


4, 5, 6, 7, 8, 9, 10, 11, 12] 


mapO 是 Python 的 一 个 内 置 函 数 ， 它 的 基本 样式 是 : 


map(func, seq) 


func 和 是 一 个 函数 ，seq 是 一 个 序列 对 象 。 在 执行 的 时 候 ， 序 列 对 象 中 的 


每 4 
面 ， 


个 元 素 ， 按 照 从 左 到 右 的 顺序 依次 被 取出 来 ， 塞 入 到 func 函 数 里 
并 将 func 的 返回 值 依次 存 到 一 个 列表 中 。 


在 应 用 中 ，map 所 能 实现 的 也 可 以 用 别 的 方式 实现 。 比 如 : 


>>> items = [1, 2, 3, 4, 5] 


>>> squared = [] 


>>> for i in items: 


squared.append(i**2) 


>>> squared 


-4 9; 16, 25] 


>>> def sqr(x): return x**2 


>>> map(sqr, items) 


,4, 9, 16, 25] 


>>> map(lambda x: x**2, items) 


[1, 


4, 9, 16, 25] 


>>> [ x**2 for x in items ] # 这 个 我 最 喜欢 了 ， 速 度 快 ， 可 读 性 强 


[1, 


4, 9, 16, 25] 


条 条 大 路 通 罗马 ， 在 编程 中 ， 以 上 方法 目 己 根 据 需 要 来 选 
在 以 上 感性 认识 的 基础 上 ， 表 来 阅读 map() 的 官方 说 明 ， 能 够 更 明日 一 


此 。 


map (function, iterable, ...) 


Apply function to every item of iterable and return a list of the results.If 
additional iterable arguments are passed, function must take that many 
arguments and is applied to the items from all iterables in parallel.If one 
iterable is shorter than another it is assumed to be extended with None 
items.If function is None, the identity function is assumed;if there are 
multiple arguments, map()returns a list consisting of tuples containing the 
corresponding items from all iterables (a kind of transpose 

operation) .The iterable arguments may be a sequence or any iterable 
object;the result is always a list. 


理解 要 点 : 


。 对 iterable 中 的 每 个 元 素 ， 依 次 应 用 function 的 方法 (函数 )”( 这 本 
质 上 就 是 一 个 for 循 环 ) 。 

。 将 所 有 结果 返回 一 个 列表 。 

。 如 果 参 数 很 多 ， 则 对 那些 参数 并 行 执 行 function 。 


例如 : 


>3%. IstL.= [2.3475] 
>>> lst2 = [6,7,8,9,0] 
>>> map(lambda x, y: x+y, lst1, lst2) 


[27 :9; 1 1 15] 


请 读者 注意 了 ， 上 面 这 个 例子 如 采用 for 循 环 来 写 ， 还 不 是 很 难 ， 如 果 
扩展 一 下 ， 下 面 的 例子 用 for 来 改写 ， 束 要 小 心 了 : 


> 二] 


>>> lst2 = [6,7,8,9,0] 
| 
>>> map(lambda x, y, z: x+y+z, lst1, lst2, lst3) 


[14, 17, 20, 15, 6] 


这 才 显 示 出 map 的 人 简洁 优雅 。 


reduce 


直接 看 这 个 : 


>>> reduce(lambda x, y : x+y, [1，2，3，4，5]) 


15 


请 仔细 观察 ， 是 否 能 够 看 出 如 何 运 算 的 呢 ? 如 图 3-2 所 示 。 


图 3-2 运算 图 


对 比 一 下 map0 的 运算 ， 能 更 理解 reduce0。MapO 是 上 下 运算 ， 
reduce() 是 横着 逐个 元 素 进行 运算 。 


权威 的 解释 来 目 官网 : 


reduce (function, iterable[, initializer]) 


Apply function of two arguments cumulatively to the items of iterable, 
from left to right, so as to reduce the iterable to a single value.For 
example, reduce (lambda x, y:xty, [1, 2, 3, 4, 5]) calculates 

( ( ( (1+2) +3) +4) +5) .The left argument, x, is the accumulated 
value and the right argument, y, is the update value from the iterable.If 
the optional initializer is present, itis placed before the items of the 
iterable in the calculation, and serves as a default when the iterable is 
empty.If initializer is not given and iterable contains only one item, the 
first item is returned.Roughly equivalent to: 


def reduce(function, iterable, initializer=None): 
it = iter(iterable) 
if initializer is None: 
try: 
initializer = next(it) 
except StopIteration: 
raise TypeError('reduce() of empty sequence with no initial value') 
accum_value = initializer 
for x in it: 
accum_value = function(accum value, x) 


return accum value 


如 果 用 我 们 熟悉 的 for 人 循环 来 做 上 面 reduce 的 事情 ， 可 以 这 样 来 做 : 


>>> lst = range(1, 6) 

>>> lst 

| a We 

>>>r=0 

>>> for i in range(len(1st)): 


rs St 


> 


for 是 普 适 的 ，reduce 是 简洁 的 。 
为 了 锻炼 思维 ， 看 这 么 一 个 问题 ， 有 两 个 list，a=[3，9，8，5，2]，Pb= 
[1，4，9，2，6]， 计 算 : a[0]*b[0]+a[1]*b[1]+... 的 结果 。 


>>> a 


[3，9，8，5，2] 


>>> b 


[1，4，9，2，6] 


>>> zip(a ,b) 


[(3, 1), (9, 4), (8, 9), (5, 2), (2, 6)] 


>>> sum(x*y for x, y in zip(a, b)) # 解 析 后 直接 求 和 


133 


>>> new_list = [x*y for x, y in zip(a，b)]  # 可 以 看 作 是 上 面 方法 的 分 步 实施 


>>> # 这 样 解析 也 可 以 : new_tuple = (x*y for x, y in zip(a, b)) 

>>> new_list 

[3, 36, 72, 10, 12] 

>>> sum(new_list) # 或 者 :sum(new_tuple) 


133 


>>> reduce(lambda sum, (x, y): sum + x*y, zip(a,b), 90) # 这 个 方法 是 在 要 酪 呢 吗 ? 


133 


>>> from operator import add, mul # 现 酷 的 方法 也 不 止 一 个 
>>> reduce(add,map(mul,a,b)) 


133 


>>> reduce(lambda x,y: x+y, map(lambda x,y: x*y, a,b)) #map,reduce,1lambda 都 齐全 了 


133 


如 果 读 者 使 用 的 是 Python 3， 会 跟 上 面 有 点 儿 不 一 样 ， 因 为 在 Python 3 
中 ，reduce0 已 经 从 全 局 命名 空间 中 移 除 ， 放 到 了 functools 模 块 中 ， 如 
果 要 是 用 ， 需 要 用 from functools import reduce 引 入 之 。 


3.filter 


filter 的 中 文 含 义 是 “过滤 器”， 在 Python 中 ， 它 起 到 了 过 滤器 的 作用 。 
官方 文档 中 这 么 说 : 


filter (function, iterable) 


Construct a list from those elements of iterable for which function returns 
true.iterable may be either a sequence, a container which supports 
iteration, or an iterator.If iterable is a string or a tuple, the result also has 
that type;otherwise it is always a list.If function is None, the identity 


function is assumed, thatis, all elements of iterable that are false are 
removed. 


Note that filter (function，iterable) is equivalent to[item for item in 
iterable if function (item) |]Jif function is not None and[item for item in 
iterable if itemlif function is None. 


这 次 真 的 不 翻译 了 ， 而 且 也 不 解释 要 点 了 。 请 读者 务必 目 己 阅 读 上 面 
的 文字 ， 并 且 理 解 其 含义 。 


通过 下 面 的 程序 代码 体会 : 


[-5，-4，-3，-2，-1，9，1，2，3，4] 


>>> filter(lambda x: x>0, numbers) 


[1, 2, 3, 4] 


>>> [x for x in numbers if x>0] # 与 上 面 那 句 等 效 


[1, 2, 3, 4] 


>>> filter(lambda c: c!='i', 'giwsir') 


'qwsr' 


至 此 ， 介 绍 了 几 个 钞 数 ， 这 些 函 数 在 对 程序 的 性 能 提高 上 并 没有 显 车 
或 者 稳定 预期 但是， 在 代码 的 简洁 上 是 有 目 共 睹 的 。 有 时 候 可 以 用 
来 秀一 秀 ， 以 彰显 Python 的 优雅 ， 或 者 目 己 要 酷 。 如 何 用 及 怎么 用 ， 
吕 看 你 目 己 的 喜好 了 。 


3.5 ”练习 


仅仅 知道 了 函数 的 知识 是 远 远 不 够 的 ， 必 须要 勤 练 习 、 多 融 代 码 ， 才 
J 才能 熟练 使 用 。 所 以 ， 这 里 专门 设立 一 廊 ， 带 领 读 者 做 几 
广 红 为 “。 


首先 声明 ， 以 下 对 每 个 问题 的 解决 方案 ， 不 一 定 是 最 优 的 。 如 果 读 者 
有 更 好 的 解决 方案 ， 可 以 分 享 (到 我 的 网 站 www.itdiffer.com 能 够 找到 
各 种 联系 我 的 方法 ) 。 


读者 完成 下 面 的 练习 ， 请 遵守 如 下 规则 (全 看 你 的 目 我 控制 能 力 了 ， 
目 控 能 力 强 的 胜出 ， 不 要 欺骗 哦 ， 因 为 上 营 在 看 着 你 呢 ) : 


ee 


。 也 给 出 了 参考 代码 ， 但 是 ， 参 考 代 码 并 不 是 最 终结 
。 可 以 在 上 述 基 础 上 对 代码 进行 完善 。 
。 如 果 读 者 愿意 ， 可 以 将 代码 提交 到 github 上 跟 大 家 分 诗 。 


3.5.1 人 解 一 元 二 次 方程 


解 一 元 二 次 方程 是 初中 数学 中 的 基本 知识 ， 一 般 来 讲解 法 有 公式 法 、 
» 予 O 〇 


最 简单 的 思路 殉 是 用 公式 法 求解 ， 这 是 普 适 法 则 。 


十 巴比伦 留 下 的 陶 片 显示 ， 在 大 约 公元 前 2000 年 (2000 BC) 上 古巴 比 
伦 的 数学 家 就 能 解 一 元 二 次 方程 了 。 在 大 约 公元 前 480 年 ， 中 国人 已 经 
使 用 配方 法 求 得 了 二 次 方程 的 正 根 ， 但 是 并 没有 提出 通用 的 求解 方 
法 。 公 元 前 300 年 左右 ， 欧 几 里 得 提出 了 一 种 更 抽象 的 几何 方法 求解 二 
次 方程 。 

7 世纪 印度 的 婆罗 摩 笈 多 (Brahmagupta) 是 第 一 位 懂得 使 用 代数 方程 
的 人 ， 同 时 容许 方程 有 正 负数 的 根 。 

11 世 纪 阿 拉 伯 的 花 拉 子 密 独 立地 发 展 了 一 套 公 式 以 求 方程 的 正 数 解 。 
亚伯拉罕 : 巴 希 亚 〈 亦 以 拉丁 文 名 字 耶 瓦 索 达 若 称 ) 在 他 的 著作 《Liber 
embadorum》 中 ， 首 次 将 完整 的 一 元 二 次 方程 解法 传 入 欧洲 。 ( 源 目 
《维基 百科 》) 

参考 代码 : 


#!/usr/bin/env python 


# coding=utf-8 


solving a quadratic equation 


import math 


def quadratic_ equation(a,b,c): 

delta =b*b-4*a*c 

if delta < 0: 
return False 

elif delta == 0: 
return -(b/ (2 * a)) 

se 
sqrt_delta = math.sqrt(delta) 
x1 = (-b + sqrt_delta) / (2 * a) 
x2 = (-b - sqrt_delta) / (2 * a) 


return x1i, x2 


Er name. == "main__" 


print "a quadratic equation: x^2 + 2x +1=0" 
coefficients = (1, 2, 1) 
roots = quadratic_ equation(*coefficients) 
4 Onts: 
print "the result is:", roots 
else: 


print "this equation has no solution." 


保存 为 20501.py， 并 运行 之 : 


$ python 20501.py 
a quadratic equation: xA2 + 2Xx + 1 = 0 


the result is: -1.0 


能 够 正常 运行 ， 求 解 方 程 。 
但 是 ， 如 果 再 认真 思考 ， 会 发 现 上 述 代 码 是 有 很 大 改进 空间 的 : 


1. 如 果 不 小 心 将 第 一 个 系数 (a) 的 值 输入 了 0， 程 序 肯定 会 报错 。 如 
何 避 人 免 之 ? 要 记 住 ， 任 何人 的 输入 都 是 不 可 靠 的 。 


2. 结 采 貌 似 只 能 是 小 数 ， 这 在 某 些 情况 下 十 近似 值 ， 能 不 能 得 到 以 分 
数 形式 表示 的 精确 结果 呢 ? 


3. 复 数 ，Python 是 可 以 表示 复数 的 ， 如 果 delta<0， 是 不 是 写成 复数 更 
好 。 


读者 是 否 还 有 其 他 改进 呢 ? 你 能 不 能 进行 改进 ， 然 后 跟 我 和 其 他 朋友 
一 起 来 分 诗 你 的 成 就 呢 ? 


至 少 要 完成 上 述 改进 ， 可 能 需要 其 他 有 关 Python 的 知识 ， 甚 至 于 前 面 
没有 介绍 。 这 都 不 有 要紧， 掌握 了 基本 知识 之 后 ， 在 编程 的 过 程 中 ， 融 
要 不 断 发 挥 google 搜 索 的 优势 ， 让 它 帮 助 你 找寻 完成 任务 的 工具 。 


Python 是 一 个 开发 的 语言 ， 很 多 大 牛人 都 写 了 一 些 工 具 让 别人 使 用 ， 
城 轻 了 后 人 的 家 动 负担 ， 这 束 是 所 谓 的 第 三 方 模块 。 虽 然 Python 中 已 
经 有 一 些 “ 目 市 电池 ”， 即 移 认 安装 ， 比 如 上 面 程序 中 用 到 的 math， 但 
征 我 们 还 嫌 不 够 。 于 是 有 很 多 第 三 方 的 模块 来 专门 解决 某 个 问题 。 比 

人 
悍 引 具 。 


3.5.2 ”统计 考试 成 绩 


每 次 考试 之 后 ， 教 师 都 要 统计 考试 成 绩 ， 一 般 包 括 : 平均 分 ， 以 及 对 
所 有 人 按 成 绩 从 高 到 低 排 队 ， 谁 成 绩 最 好 ， 谁 成 绩 最 差 等 。 下 面 的 任 
务 就 是 读者 转动 脑筋 ,思考 如 何 用 程序 实现 考试 成 绩 统 计 。 为 了 人 简 

化 ， 以 字典 形式 表示 考试 成 绩 记 录 ， 例 如 ， 

{"zhangsan":90, "lisi":78, "wangermazi":39}, 当然 ， 世 许 不 止 这 二 

0 i 


坟 么 做 ? 
有 几 种 可 能 要 考虑 到 : 
。 最 高 分 或 者 最 低 分 ， 可 能 有 人 并 列 。 
。 要 实现 不 同 长 度 的 字典 作为 输入 值 。 
。 输 出 结果 中 ， 除 了 平均 分 ， 其 他 的 都 要 有 姓名 和 分 数 两 项 ， 否 则 
都 匿名 了 ， 怎 么 刺激 学 次 、 表 招 学 霸 呢 ? 


不 管 你 是 学 渔 还 是 学 霸 ， 都 能 学 好 Python。 请 思考 后 敲 代码 调试 你 的 
程序 ， 调 试 之 后 再 阅读 下 文 。 


参考 代码 : 


#!/usr/bin/env python 


# coding=utf-8 


统计 考试 成 绩 


from _ future _ import division 


def average_Sscore(Sscores ) : 


统计 平均 分 ， 


Score_Vvalues = scores.values() 
Sum_scores = sum(score_values) 
average = sum_ scores / len(score_ values) 


return average 


def sorted_score(scores): 


对 成 绩 从 高 到 低 排 队 ， 
score_lst = [(scores[k], k) for k in scores] 
sort_lst = sorted(score_lst, reverse=True) 


return [(i[1], i[0]) for i in sort_lst] 


def max_score(scores): 


成 绩 最 高 的 姓名 和 分 数 ， 
lst = sorted_score(scores) # 引 用 分 数 排序 的 函数 sorted_score 
max_score = lst[9][1] 


return [(i[90], i[1]) for i in lst if i[1] == max_score] 


def min_score(scores): 


成 绩 最 低 的 姓名 和 分 数 ， 
lst = Sorted_score(Scores) 
min_score = lst[len(lst)-1][1] 


return [(i[9],i[1]) for i in lst if i[1]==min_score] 


if name == "main__": 


examine_scores = {"google":98, "facebook":99, "baidu":52, "alibaba":80, "yahoo":49, "IBM":70, "android":76, "apple 
":99, "amazon":99} 


ave = average_score(examine_scores) 


print "the average score is: ", ave # 平 均 分 
sor = sorted_score(examine_scores) 
print "list of the scores: ",sor # 成 绩 表 


xueba = max_score(examine_scores) 


print "Xueba is: ",xueba # 学 霸 们 


print "Xuzha is: ",xuezha # 学 渣 们 


保存 为 20502.py， 然 后 运行 : 


$ python 20502.py 
the average score is: 80.2222222222 


ist of the scores: [('facebook', 99), ('apple', 99), ('amazon', 99), ('google', 98), ('alibaba', 80), ('android', 76 
,， ('IBM', 70), ('baidu', 52), ('yahoo', 49)] 


list 
), ( 
Xueba is: [('facebook', 99), ('apple', 99), ('amazon', 99)] 
Xuzh 


zha is: [('yahoo', 49)] 


貌似 结 末 还 不 错 。 不 过 ， 还 有 改进 余地 ， 看 看 现实 就 感觉 不 怎么 友好 
了 “。 能 不 能 优化 一 下 ? 当然 ， 里 面 的 函数 也 不 一 定 征 最 好 的 方法 ， 你 
也 可 以 修改 优化 。 


3.5.3” 找 质数 
0 
证 


国 ~、 


还 十 按 照 前 面 的 惯例 ， 读 者 和 完 做 ， 然 后 我 提供 参考 代码 ， 最 后 优化 。 


质数 (Prime number) ， 又 称 素数 ， 指 在 大 于 1 的 自然 数 中 ， 除 了 1 和 
此 整数 自身 外 ， 无 法 被 其 他 目 然 数 整 除 的 数 〈 也 可 定义 为 只 有 1 和 本 号 
两 个 因数 的 数 ) 。 


哥 德 巴赫 猜想 是 数论 中 存在 最 久 的 未 解 问题 之 一 。 这 个 猜想 最 早出 现 
在 1742 年 普鲁士 人 克里斯蒂 安 . 哥 德 巴赫 与 瑞士 数学 家 莱 昂 哈 德 . 欧 拉 的 
通信 中 。 可 以 用 现代 的 数学 语言 陈述 哥 德 巴 替 猜 想 为 :“ 任 一 大 于 2 的 
偶数 ， 都 可 表示 成 两 个 质数 之 和 。”。 哥 德 巴 赫 猜 想 在 提出 后 的 很 长 一 
段 时 间 内 毫 无 进展 ， 直 到 20 世 纪 20 年 代 ， 数 学 家 从 组 合 数学 与 解析 数 
论 两 方面 分 别提 出 了 解决 的 思路 ， 并 在 其 后 的 半 个 世纪 里 取得 了 一 系 
列 突破 。 目 前 最 好 的 结果 是 陈景润 在 1973 年 发 表 的 陈 氏 定理 〈 也 被 称 
为 “1+2”) 。 ( 源 自 《维基 百科 》) 


对 这 个 练习 ， 我 的 思路 是 先 做 一 个 函数 ， 用 它 来 判断 某 个 整数 是 否 是 
质数 ， 然 后 循环 即 可 。 


参考 代码 : 


#!/usr/bin/env python 


# coding=utf-8 


寻找 质数 


import math 


def is_prime(n): 


判断 一 个 数 是 否 是 质数 


if n <= 1: 
return False 
for i in range(2, int(math.sqrt(n) + 1)): 
if n% i == 0: 
return False 


return True 


if name == ”main __": 


primes = [i for i in range(2,100) if is_prime(i)] # 从 2 开始 ，1 显 然 不 是 质数 


print primes 


代码 保存 后 运行 : 


$ python 20503.py 


[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97] 


打印 出 了 100 以 内 的 质数 。 


你 或 许 也 发 现 了 这 个 程序 需要 进一步 优化 的 地 方 ， 另 外 ， 关 于 判断 质 
还 有 好 多 种 ， 读 者 可 以 目 己 创造 或 者 从 网 上 搜索 一 些 ， 拓 展 


3.5.4 编写 函数 的 注意 事项 


编写 钞 数 ， 在 开发 实践 中 是 非常 必要 和 常见 的 ， 一 般 情况 ， 你 写 的 函 
数 应 该 是 : 


。 尺 量 不 要 使 用 全 局 变量 。 

。 如 采 人 参数 是 可 变 类 型 数据 ， 则 在 函数 内 不 要 修改 它 。 

。 每 个 函数 的 功能 和 目标 要 单纯 ， 不 要 试图 一 个 函数 做 很 多 事情 
。 函数 的 代码 行 数 尽量 少 。 


。 畏 数 的 独立 性 越 强 越 好 ， 不 要 跟 其 他 的 外 部 东西 产生 关联 。 
所 生 - \- 上 HA 人 
第 2 季 进 阶 


随 看 学 习 的 深入 ， 你 一 定 体会 到 了 编程 的 乐趣 ， 同 样 也 越 来 越 多 地 听 
到 一 些 感觉 有 点 “莫名 其 妙 ?的 名 词 ， 这 些 名 词 铝 第 是 对 “ 某 个 对 象 的 行 
为 或 现状 ”的 概括 ， 这 种 概括 需要 学 习 者 用 “抽象 ”的 思维 方法 理解 。 


从 本 季 开 始 ， 我 们 将 共同 涉足 于 此 类 内 容 。“ 类 ”在 编程 中 不 断 被 用 
到 ， 所 以 ， 它 成 为 了 本 季 的 主角 。 本 季 中 其 他 内 容 都 是 对 第 1 季 知 识 的 
综合 应 用 ， 从 本 季 开 始 ， 你 所 敲 的 代码 就 越 来 越 接 近 于 开发 实践 了 。 
自古 以 来 ,“ 行 百 里 路 者 半 九 十 "， 若 能 够 坚持 读 完 本 季 的 内 容 ， 那 么 
在 Python 语 言 学 习 上 至 少 已 经 成 为 男 外 的 10%。 


生生 二 二 Sy 
第 4 章 类 
类 是 OOP 中 的 重要 概念 ， 也 是 学 习 Python 的 一 个 跨越 。 总 有 不 少 初学 
者 ， 学 到 这 里 就 感到 迷惑 。 为 此 ， 建 议 学 习 着 从 本 章 开始 一 边 看书 一 


边 葡 代码， 然后 反复 推 殴 ， 不 要 追求 速度 ， 并 且 要 多 上 网 搜索 ， 理 解 
其 中 含义 。 最 终 的 胜利 是 属于 你 的 。 


类 也 十 对 世界 的 抽象 结果 ， 所 以 ， 读 者 还 要 注意 “抽象 思维 ”方法 在 编 
程 中 的 应 用 。 如 何 才能 具有 “抽象 ”能 力 呢 ? 一 两 句 话 还 说 不 好 ， 但 
古 ， 勤 于 练习 、 惯 于 思考 是 必须 的 。 


4.1 基本 概念 

类 ， 如 果 是 你 第 一 次 听 到 这 个 词 ， 那 么 把 它 作为 一 个 单独 的 名 词 会 感 
觉 怪 怪 的 ， 因 为 在 汉语 体系 中 ， 较 常见 的 是 “ 乌 类 ”、 “人 类 ”等 词语 ， 

而 单独 说 “类 ”， 总 感 沉 前面 缺点 修饰 成 分 。 其 实 ， 它 对 应 的 是 英文 单 
词 class,“ 类 ”是 由 class 翻 译 过 来 的 ， 你 就 把 它 作 为 一 个 翻译 术语 吧 。 


除了 “类 ”这 个 术语 外 ， 还 要 经 常 提 到 OOP， 即 面向 对 象 编程 或者“ 面 
向 对 象 程序 设计 ”) 。 


为 了 理解 类 和 OOP， 需 要 对 一 些 枯燥 的 名 词 有 所 了 解 。 


“ 行 百 里 路 者 半 九 十 ”， 如 果 读 者 坚持 阅读 到 本 书 的 这 个 章节 ， 已 经 对 
Python 有 了 初步 感受 ， 而 “类 ” 束 是 能 够 让 你 在 Python 学 习 进 程 中 再 上 
台阶 的 标志 。 所 以 ,一定 要 硬 着 头皮 耐心 阅读 下 去 。 

所 谓 “ 术 语 >， 可 以 粗浅 地 理解 为 某 个 领域 的 “ 行 话 ”， 比 如 在 物理 学 里 
面 ， 有 专门 定义 的 “质量 *、“ 位 移 >、“ 速 度 ” 等 ， 这 些 术 语 有 的 跟 日 常 
生活 中 的 俗称 名 字 貌 似 一 样 ， 但 是 所 指 有 所 不 同 。 

“术语 ”的 主要 特征 是 具有 一 定 的 稳定 性 ， 并 有 旦 严谨、 简明 ， 不 是 流行 
语言 。 在 谈 到 OOP 的 时 候 豆 会 遇 到 一 些 术 语 ， 需 要 先 明 确 它 们 的 含 
义 。 本 节 没 有 特别 声明 的 术语 定义 均 来 自 维 基 百 科 。 

4.1.1 问题 空间 


问题 空间 是 问题 解决 者 对 一 个 问题 所 达到 的 全 部 认识 状态 ， 它 古 由 问 
题解 决 者 利用 问题 所 包含 的 信息 和 已 贮存 的 信息 主动 构成 的 。 
一 个 问题 一 般 从 以 下 三 个 方面 来 定义 : 

。 初始 状态 一 一 开始 时 不 完全 的 信息 或 令 人 不 满意 的 状况 。 


。 目标 状态 一 一 你 布 望 获得 的 信息 或 状态 。 
。 操作 一 一 为 了 从 初始 状态 迈 癌 目标 状态 ， 你 可 能 采取 的 步 又 。 


这 三 个 部 分 加 在 一 起 定义 了 问题 空间 (problem space) 。 

4.1.2 对象 

对 象 (object) ， 是 面向 对 象 “Object Oriented) 中 的 术语 ， 既 表示 客 
观 世 界 问题 空间 (Namespace) 中 的 某 个 具体 的 事物 ， 又 表示 软件 系 
统 解 空 间 中 的 基本 元 素 。 


把 object 翻 译 为 “对象 ” 是 比较 抽象 的 ， 因 此 ， 有 人 认为 ， 不 如 翻译 
为 “物件 ”更 好 ， 因 为 “物件 ”让 人 感到 一 种 具体 的 东西 。 


这 种 看 法 在 某 些 语言 中 是 非常 适合 的 ， 但 是 在 Python 中 则 无 所 谓 ， 不 
管 坚 样 ，Python 中 的 一 切 都 是 对 象 ， 不 管 是 字符 串 、 画 数 、 模 块 还 十 
类 都 十 对 象 ,“ 万 物 省 对 象 ”。 


都 是 对 象 有 什么 优势 吗 ? 这 说 明 Python 天 生 就 是 OOP 的 。 也 说 明 
Python 中 的 所 有 东西 都 能 够 进行 拼 恋 组 合 应 用 ， 因 为 对 象 束 是 可 以 拼 
竣 组 合 应 用 的 。 


对 于 对 象 这 个 东西 ，OOP 大 师 Grandy Booch 的 定义 应 该 是 权威 的 ， 相 
天 定义 的 内 容 如 下 。 


。 对 和 象 : 一 个 对 象 有 目 己 的 状态 、 行 为 和 唯一 的 标识 ， 所 有 相同 类 
型 的 对 象 所 具有 的 结构 和 行为 在 它们 共同 的 类 中 被 定义 。 

。 状态 (state) : 包括 这 个 对 象 已 有 的 属性 〈 通 常 是 类 里 面 已 经 定 
义 好 的 ) 和 对 象 具有 的 当前 属性 值 (这 些 属性 往往 是 动态 的 ) 。 
。 行 为 (behavior) : 是 指 一 个 对 象 如 何 影响 外 界 及 被 外 界 影响 ， 表 

现 为 对 象 目 身 状态 的 改变 和 信息 的 传递 。 
。 标识 (identity) : 是 指 一 个 对 象 所 具有 的 区 别 于 所 有 其 他 对 象 的 
属性 (本 质 上 指 内 存 中 所 创建 的 对 象 的 地 址 ) 。 


大 师 的 话 的 确 有 水 平 ， 听 起 来 非 党 高深。 不过， 初学 者 可 能 理解 起 来 
有 把 困 难 ， 下 面 把 大 师 的 话 化 简 一 下 。 


简化 之 ， 对 和 象 应 该 具有 属性 (就 是 上 面 的 状态 ， 因 为 属性 更 常用 ) 、 
方法 (就 是 上 面 的 行为 ， 方 法 常 被 使 用 ) 和 标识 。 因 为 标识 是 内 存 中 
目 动 完成 的 ， 所 以 ， 平 时 不 用 怎么 管理 它 ， 主 要 就 是 属性 和 方法 。 


为 了 体现 “深入 浅 出 ”的 道理 ， 下 面 讲 一 个 故事 。 


既然 万 物 都 是 对 象 ， 那 么 ， 某 个 具体 的 人 也 是 对 象 。 假 设 以 某 个 “ 王 美 
女 ” 为 对 象 说 明 (这 个 王 美 女 完 全 是 虚构 的 ， 请 不 要 对 号 入 座 ， 更 不 要 
想入非非 ， 如 果 雷 同 ， 纯 属 巧合 ) 。 


“ 王 美 女 ” 这 个 对 象 具有 某 些 特征 ， 有 眼睛 ， 大 ; 腿 ， 长 ， 皮 肤 ， 白 。 当 
然 ， 既然 是 美女 ， 肯 定 还 有 别 的 显明 特征 ， 读 者 可 以 目 己 去 假设 。 如 
果 用 “对 象 ” 的 术语 来 说 明 ， 束 说 这 些 特征 都 是 她 的 属性 ， 也 整 是 说 属 
性 十 一 个 对 象 所 具有 的 特征 ， 或 日 :是 什么 。 

“ 王 美 女 ” 除 了 具有 上 面 的 特征 之 外 ， 还 能 做 一 些 事 情 ， 比 如 能 唱歌 、 


会 吹 拉 弹 唱 等 。 这 些 都 是 她 能 够 做 的 事情 。 用 “对 象 "的 术语 来 说 ， 这 
忠 是 她 的 “方法 ”， 即 方法 就 是 对 象 能 够 做 什么 。 


> 属性 (是 什么 ) 和 方法 (能 做 什 
A O 


4.1.3 面向 对 象 


面向 对 象 ， 不 是 说 你 面 对 这 位 “ 王 美 女 "?"， 是 指 程序 员 在 开发 程序 的 时 
候 要 怎么 思考 问题 ， 怎 么 构建 程序 的 事情 。 


面向 对 象 程 序 设计 《英语 : Object-oriented programming， 缩 写 : 
OOP) 是 一 种 程序 设计 范 型 ， 同 时 也 是 一 种 程序 开发 的 方法 。 对 象 指 
的 是 类 的 实例 ， 它 将 对 象 作 为 程序 的 基本 单元 ， 将 程序 和 数据 封装 其 
中 ， 以 提高 软件 的 重用 性 、 灵 活性 和 扩展 性 。 


面向 对 象 程序 设计 可 以 看 作 是 一 种 在 程序 中 包含 各 种 独立 而 又 互相 调 
用 的 对 象 的 思想 ， 这 与 传统 的 思想 刚好 相反 : 传统 的 程序 设计 主张 将 
程序 看 作 是 一 系列 函数 的 集合 ， 或 者 直接 就 是 一 系列 对 电脑 下 达 的 指 
令 。 面 向 对 象 程序 设计 中 的 每 一 个 对 象 都 应 该 能 够 接受 数据 、 处 理 数 
因此 它们 都 可 以 被 看 作 是 一 个 小 型 的 “机 
串 ” 即 对 象 = 


目前 已 经 被 证 实 的 是 ， 面 同 对 象 程序 设计 推广 了 程序 的 灵活 性 和 可 维 
护 性 ， 并 且 在 大 型 项 目 设计 中 广 为 应 用 。 此 外 ， 文 持 者 声称 面 加 对象 
程序 设计 要 比 以 往 的 做 法 更 加 便于 学 习 ， 因 为 它 能 够 让 人 们 更 简单 地 
设计 并 维护 程序 ， 使 得 程序 更 加 便于 分 析 、 设 计 、 理 解 。 反 对 者 在 茶 
些 领域 对 此 予以 否认 。 


当 我 们 提 到 面向 对 象 的 时 候 ， 它 不 仅 指 一 种 程序 设计 方法 ， 更 多 意义 
上 是 一 种 程序 开发 方式 。 在 这 一 方面 ， 我 们 必须 了 解 更 多 天 于 面向 对 
象 系统 分 析 和 面向 对 象 设计 (Object Oriented Design， 人 简称 OOD) 方 
面 的 知识 。 


下 面 再 引用 一 段 来 目 维基 百科 中 关于 OOP 的 历史 。 为 什么 要 了 解 历 
史 ? 因为 历史 可 是 过 去 的 今天 ， 反 映 了 人 类 的 思维 发 展 过 程 。 


面向 对 象 程序 设计 的 雏形 ， 早 在 1960 年 的 Simula 语 言 中 即 可 发 现 ， 当 
时 的 程序 设计 领域 正面 临 着 一 种 危机 : 在 软 便 件 环境 逐渐 复杂 的 情况 
下 ， 软 件 如 何 得 到 民 好 的 维护 ? 面 癌 对 象 程序 设计 在 某 种 程度 上 通过 
强调 可 重复 性 解决 了 这 一 问题 。20 世 纪 70 年 代 的 Smalltalk 语 言 在 面向 


对 象 方面 堪 称 经 典 一 一 以 至 于 30 年 后 的 今天 依然 将 这 一 语言 视 为 面 癌 
对 象 语言 的 基础 。 


计算 机 科学 中 对 象 和 实例 概念 的 最 早 萌 芽 可 以 追溯 到 厅 省 理工 学 院 的 
PDP-1 系 统 。 这 一 系统 大 概 是 最 早 的 基于 容量 架构 (capability based 
architecture) 的 实际 系统 。 另 外 1963 年 Ivan Sutherland 的 Sketchpad 应 用 
中 也 强 含 了 同样 的 思想 。 对 象 作为 编程 实体 最 早 于 20 世 纪 60 年 代 由 
Simula 67 语 言 引 入 思维 。Simula 这 一 语言 是 奥 利 -约翰 :达尔 和 克利 斯 登 
: 奈 加 特 在 挪威 奥斯陆 计算 机 中 心 为 模拟 环境 而 设计 的 (据说 ， 他 们 是 
为 了 模拟 船只 而 设计 的 这 种 语言 ， 并 且 对 不 同 船 只 间 属 性 的 相互 影响 
感 兴趣 。 他 们 将 不 同 的 船只 归纳 为 不 同 的 类 ， 而 每 一 个 对 象 ， 基 于 它 
的 类 ， 可 以 定义 它 自 己 的 属性 和 行为 ) 。 这 种 办 法 是 分 析 式 程序 的 最 
早 概念 体现 ， 在 分 析 式 程序 中 ， 我 们 将 真实 世界 的 对 象 映射 到 抽象 的 
对 和 象 叫 作 “ 模 拟 ?。Simula 不 仅 引 入 了 “类 ”的 概念 ， 还 应 用 了 实例 这 一 
思想 一 一 这 可 能 是 这 些 概 念 的 最 早 应 用 。 


20 世 纪 70 年 代 施乐 PARC 研 究 所 发 明 的 Smalltalk 语 言 将 面 问 对 象 程序 设 
计 的 概念 定义 为 : 在 基础 运算 中 ， 对 对 象 和 消 居 的 广泛 应 用 。 
Smalltalk 的 创建 者 深 受 Simula 67 的 主要 思想 影响 ， 但 Smalltalk 中 的 对 
D 它们 可 以 被 创建 、 修 改 并 销毁 ， 这 与 Simula 中 的 
静态 对 和 象 有 所 区 别 。 此 外 ，Smalltalki 丰 引入 了 继承 性 的 思想 ， 因 此 一 
举 超越 了 不 可 创建 实例 的 程序 设计 模型 和 不 具备 继承 性 的 Simula。 此 
外 ，Simula 67 的 思想 亦 被 应 用 在 许多 不 同 的 语言 中 ， 如 Lisp、Pascal 。 


面向 对 象 程序 设计 在 20 世 纪 80 年 代 成 为 了 一 种 主导 思想 ， 这 主要 应 归 
功 于 C++。 在 图 形 用 户 界面 (GUI) 日 渐 崛 起 的 情况 下 ， 面 向 对 象 程 
序 设计 很 好 地 适应 了 潮流 。GUI 和 面向 对 象 程序 设 计 的 紧密 关联 在 
Mac OS X 中 可 见 一 班 。Mac OS X 是 由 Objective-C 语 言 写成 的 ， 这 一 语 
言 是 一 个 仿 Smalltalk 的 C 语 言 扩 充 版 。 面 问 对 象 程序 设计 的 思想 也 使 事 
件 处 理 式 的 程序 设计 应 用 地 更 加 广泛 (虽然 这 一 概念 并 非 仅 存在 于 面 
向 对 象 程序 设计 ) 。 一 种 说 法 是 ，GUI 的 引入 极 大 地 推动 了 面向 对 象 
程序 设计 的 发 展 。 


苏黎世 联邦 理工 学 院 的 尼克 劳 斯 -维尔 特 和 他 的 同事 们 对 抽象 数据 和 模 
块 化 程序 设计 进行 了 研究 。Modula-2 将 这 些 都 包括 了 进去 ， 而 Oberon 
则 包括 了 一 种 特殊 的 面 癌 对 象 方法 不 同 于 Smalltalk 与 C++。 


面 回 对 象 的 特性 也 被 加 入 了 当时 较为 流行 的 语言 ， 如 Ada、BASIC、 
Lisp、Fortran、Pascal 等 。 由 于 这 些 语言 最 初 并 没有 面 癌 对 象 的 设计 ， 
故而 这 种 故 合 常 常会 导致 兼容 性 和 维护 性 的 问题 。 与 之 相反 的 是 ,“ 纯 
正 的 ”面向 对 象 语言 却 缺 乏 一 些 程 序 员 们 赖 以 生存 的 特性 。 在 这 一 大 环 
境 下 ， 开 发 新 的 语言 成 为 了 当务之急 。 作 为 先行 者 ，Eiffel 成 功 地 解决 
了 这 些 问 题 ， 并 成 为 了 当时 较 受 欢迎 的 语言 。 


在 过 去 的 儿 年 中 ，Java 语 言 成 为 了 广 为 应 用 的 语言 ， 除 了 它 与 C 和 
C++ 语法 上 的 近似 性 。Java 的 可 移植 性 是 它 的 成 功 中 不 可 麻 灭 的 一 
步 ， 因 为 这 一 特性 已 吸引 了 庞大 的 程序 员 群 的 投入 。 


在 最 近 的 计算 机 语言 发 展 中 ， 一 些 既 文 持 面 问 对 象 程序 设计 ， 又 文 持 
面 癌 过 程 程序 设计 的 语言 悄然 浮 出 水 面 。 它 们 中 的 佼佼 者 有 Python 、 


Ruby 等 。 


正如 面向 过 程 程序 设计 使 得 结构 化 程序 设计 的 技术 得 以 提升 ， 现 代 的 
面 问 对 象 程序 设计 方法 使 得 对 设计 模式 的 用 途 、 阎 约 式 设计 和 建 模 语 
言 (如 UML) 技术 也 得 到 了 一 定 提升 。 


阅读 到 此 ， 如 果 读 者 把 前 面 的 文字 逐 句 读 过 ， 没 有 跳跃 ， 则 姑且 认为 
°。 那么 ， 类 和 OOP 有 什么 
天 系 呢 ? 
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在 面 癌 对 象 程式 设计 中 ， 类 (class) 是 一 种 面 癌 对 象 计算 机 编程 语言 
是 创建 对 象 的 蓝图 ， 描 述 了 所 创建 的 对 象 共同 的 属性 和 方 
壮志 


类 的 更 严格 的 定义 征 由 某 种 特定 的 元 数据 所 组 成 的 内 聚 的 包 。 它 描述 
了 一 些 对 象 的 行为 规则 ， 而 这 些 对 象 束 被 称 为 该 类 的 实例 。 类 有 接口 
和 结构 。 接 口 撒 述 了 如 何 通过 方法 与 类 及 其 实例 互 操作 ， 而 结构 描述 
了 一 个 实例 中 数据 如 何 划分 为 多 个 属性 。 类 是 与 菏 个 层 的 对 象 的 最 具 
体 的 类 型 。 类 还 可 以 有 运行 时 表示 形式 (元 对 象 ，， 它 为 操作 与 类 相 
天 的 元 数据 提供 了 运行 时 文 持 。 


文 持 类 的 编程 语言 在 文 持 与 类 相关 的 各 种 特性 方面 都 多 多 少 少 有 一 些 
微妙 的 差异 。 大 多 数 都 支持 不 同形 式 的 类 继承 。 许 多 语言 还 文 持 提供 


封装 性 的 特性 ， 比 如 访问 修 师 待 。 类 的 出 现 ， 为 面 癌 对 象 编程 的 三 个 
最 重要 的 特性 (封装 性 、 继 承 性 、 多 态 性 ) 提供 了 实现 的 手段 。 


看 到 这 里 ， 读 者 或 许 有 一 个 认识 ， 要 OOP 编 程 束 得 用 到 类 。 但 是 ， 反 
过 来 就 不 能 说 了 ， 不 是 用 了 类 了 就 一 定 是 OOP。 

4.1.5 ”编写 类 

首先 要 明确 ， 类 是 对 某 一 群 具 有 同样 属性 和 方法 的 对 象 的 抽象 。 比 如 
这 个 世界 上 有 很 多 长 翅膀 并 且 会 飞 的 生物 ， 于 是 聪明 的 人 们 就 将 它们 
统一 称 为 “ 乌 ”* 一 一 这 就 是 一 个 类 ， 虽 然 它 也 可 以 称 作 “ 鸟 类 ”。 


还 十 以 类 女 为 例子 ， 因 为 这 个 例子 不 仅 能 让 读者 阅读 时 不 犯困 ， 还 能 
兴趣 改 然 。 


要 定义 类 ， 束 要 抽象 ， 找 出 共同 的 方面 。 


class 美女 : # 用 class 来 声明 ， 后 面 定义 的 是 一 个 类 


pass 


从 这 里 开始 编写 一 个 类 ， 不 过 这 次 暂时 不 用 Python， 而 是 用 伪 代 码 ， 
当然 ， 这 个 代码 跟 Python 相 去 甚 远 。 如 下 : 


class 美女 : 


定义 了 一 个 名 称 为 “志文 ”的 类 ， 其 中 约定 ， 没 有 括号 的 是 属性 ， 市 有 
人 


对 于 一 个 具体 的 天文 ， 比 如 前 面 提 到 的 王 美 女 ， 她 站 上 面 所 定义 的 “天 
女 ” 那 个 类 的 具体 化 ， 这 在 编程 中 称 为 “类 女 类 ”的 实例 。 


王 美女 = 美女 () 


用 这 样 一 种 表达 方式 束 是 将 “美女 类 ”实例 化 了 ， 对 “ 王 美 女 ” 这 个 实 
例 ， 束 可 以 具体 化 一 些 属 性 ， 比 如 胸围 ， 还 可 以 具体 实施 一 些 方法 ， 
比如 做 饭 。 通 党 可 以 用 这 样 一 种 方式 表示 : 


a = 王 美女 .胸围 


用 点 号 “.” 的 方式 ， 表 示 王 美女 胸围 的 属性 ， 得 到 的 变量 a 束 是 90。 忆 
外 ， 还 可 以 通过 这 种 方式 给 属性 赋值 ， 比 如 


王 美女 .皮肤 = black 


这 样 ， 这 个 实例 ( 王 美女 ) 的 皮肤 就 是 黑色 的 了 。 
通过 实例 ， 也 可 以 访问 菜 个 方法 ， 比 如 : 


王 美女 ,做 饭 ( ) 


这 束 是 在 执行 一 个 方法 ， 让 王 美女 这 个 实例 做 饭 。 现 在 也 比较 好 理 
解 ， 只 有 一 个 具体 的 实例 才能 做 饭 。 

4.2 ”详解 类 

现在 开始 不 用 伪 代 码 了 ， 用 真正 的 Python 代 码 来 理解 类 。 当 然 ， 例 子 
还 是 要 用 读者 感 兴 趣 的 例子 。 

4.2.1 新式 类 和 旧式 类 


因为 Python 是 一 个 不 断 发 展 的 高 级 语言 ， 导 致 了 在 Python 2.x 的 版 本 

中 ， 有 “新 式 类 ”和 “旧式 类 (也 叫做 经 典 类 ) ”之 分 。 新 式 类 是 Python 
2.2 引 | 进 的 ， 在 此 后 的 版 本 中 ， 我 们 一 般 用 的 都 是 新 式 类 。 本 着 知 其 然 
还 要 知 其 所 以 然 的 目的 ， 简 单 回顾 一 下 两 者 的 差别 。 


>>> class AA: 


pass 


这 定义 了 一 个 非常 傈 单 的 类 ， 而 且 古 旧式 类 。 至 于 如 何 定义 类 ， 下 面 
会 详细 说 明 。 读 者 姑且 认同 我 刚才 建立 的 名 为 AA 的 类 ， 为 了 简单 ， 这 
个 类 内 部 什么 也 不 做 ， 就 是 用 pass 一 带 而 过 。 但 不 管 怎样 它 是 一 个 
类 ， 而 且 是 一 个 旧式 类 。 


然后 ， 将 这 个 类 实例 化 : 


aa = AA() 


要 起 记 实例 化 的 时 候 类 的 名 称 后 面 有 一 对 括号 。 接 下 来 做 如 下 操 


>>> type(AA) 


<type 'classobj'> 


<class main__.AA at QOxb71f017c> 


解读 一 下 上 面 的 含义 。 


。type (AA) : 查看 类 AA 的 类 型 ， 返 回 的 是 'classobj'。 

。 aa，_ class ”: aa 是 一 个 实例 ， 也 是 一 个 对 象 ， 每 个 对 象 都 有 
_class ”属性 ， 用 于 显示 它 的 类 型 。 这 里 返回 的 结果 是 ， 从 这 个 
结果 中 可 以 读 出 的 信息 是 ，aa 是 类 AA 的 实例 ， 并 且 类 AA 在 内 存 
中 的 地 址 是 0xb71f017c 。 

type (aa) : 是 要 看 实例 aa 的 类 型 ， 它 显示 的 结果 是 instance， 意 
思 是 告诉 我 们 它 的 类 型 是 一 个 实例 。 


在 这 里 是 不 是 感觉 有 点 不 和 谐 昵 ?aa._class_ 和 type (aa) 都 可 以 碍 
看 对 象 类 型 ， 但 是 它们 显示 不 一 样 的 结果 。 比 如 ， 查 看 这 个 对 象 : 


>>> a = 7 


别 环 记 了 ， 前 面 提 到 过 的 “万 物 缘 对 象 "， 那 么 一 个 整数 7 也 十 对 象 ， 用 
两 种 方式 查看 ， 返 回 的 结果 一 样 。 为 什么 到 类 (严格 讲 是 旧式 类 ) 这 
里 ,居然 返回 的 结果 不 一 样 呢 ? 太 不 和 谐 了 。 

于 是 乎 ， 就 有 了 新 式 类 ， 从 Python 2.2 开 始 ， 变 成 这 样 了 : 


>> class BB(object): 


pass 


>>> bb = BB() 
>>> bb. class_ _ 


<class '_ main_ .BB'> 


>>> type(bb) 


<class ' ”main _ .BB'> 


终于 把 两 者 统一 起 来 了 ， 世 界 和 谐 了 。 

这 就 古 新 式 类 和 旧式 类 的 不 同 。 

当然 ， 不 同 点 绝 非 仅仅 于 此 ， 这 里 只 不 过 提 到 一 个 现在 能 够 理解 的 不 
同 去 了 。 另 外 的 不 同 还 在 于 两 者 对 于 多 重 继承 的 查找 和 调用 方法 不 
同 ， 旧 式 类 十 深度 优先 ， 痢 式 类 是 广度 优先 。 


不 管 是 新 式 类 还 是 旧式 类 ， 都 可 以 通过 这 样 的 方法 查看 它们 在 内 存 中 
的 存储 空间 信息 。 


Nn__.AA instance at 9xb71efd4c> 


>>> print bb 


.BB object at 0xb71lefe6c> 


两 个 实例 分 别 告诉 了 我 们 其 是 基于 谁 生 成 的 ， 不 过 还 是 稍 有 区 别 。 
知道 了 旧式 类 和 新 式 类 ， 那 么 下 面 的 所 有 和 内容 束 都 是 对 新式 类 而 
言 。“ 喜 新 厌 旧 ?不 是 编程 经 章 干 的 事情 吗 ? 所 以 ， 旧 式 类 殊 不 是 我 们 
讨论 的 内 容 了 。 


还 要 注意 ， 如 有 果 你 用 的 是 Python 3， 束 不 用 为 独 式 类 和 旧式 类 而 担心 
了 ， 因 为 在 Python 3 中 压根 儿 束 不 存在 这 个 问题 。 


如 何 定义 新 式 类 呢 ? 
第 一 种 定义 方法 如 同 前 面 那样 : 


>>> class BB(object ) : 


pass 


跟 旧 式 类 的 区 别 就 在 于 类 的 名 字 后 面 跟 上 (object) ， 这 其 实 是 一 种 名 
为 “继承 ”的 类 的 操作 ， 当 前 的 类 BB 是 以 类 object 为 上 级 的 (object 锌 称 
为 父 类 ) ， 即 BB 是 继承 目 类 object 的 新 类 。 在 Python 3 中 ， 所 有 的 类 和 目 
然 地 都 是 类 object 的 子 类 ， 殊 不 用 彰显 出 继承 关系 了 。 


第 二 种 定义 方法 ， 在 类 的 前 面 写 上 : __metaclass ”==type， 然 后 定义 
类 的 时 候 ， 就 不 需要 在 名 字 后 面 写 (object) 了 。 


>>> _ metaclass _ = type 


>>> class CC: 


pass 


>>> type(cc) 


<class ' ”main .CC'> 


两 种 方法 ， 任 你 选用 ， 没 有 优 劣 之 分 。 
4.2.2 创建 类 


在 一 般 情 况 下 ， 一 个 类 不 是 两 三 行 就 能 搞定 的 。 所 以 ， 下 面 可 能 很 少 
UT 因为 那样 一 旦 有 一 点 错误 右前 功 尽 弃 。 下面 改 用 编 
且 介 2 


#!/usr/bin/env python 


# coding=utf-8 
_ metaclass = type 
class Person: 
def _ init_ (self, name): 


self.name = name 


def getName(self): 


return self.name 


def color(self, color): 


print "%s is %s" % (self.name, color) 


| 是 一 个 比较 常见 的 类 ， 下 面 对 这 个 “大 从 脸 ” 的 类 进行 一 一 
年 笠 。 


(1) 新 式 类 
_ metaclass_”=type， 意 味 着 下 面 的 类 是 新 式 类 。 
(2) 定义 类 


class Person， 这 是 在 声明 创建 一 个 名 为 “Person” 的 类 。 类 的 名 称 一 般 用 
大 写字 母 开 头 ， 这 是 惯例 。 如 果 名 称 是 两 个 单词 ， 那 么 两 个 单词 的 首 
字母 都 要 大 写 ， 例 如 class HotPerson， 这 种 命名 方法 有 一 个 形象 的 名 
字 ， 叫 作 * 驼 峰 式 命名 ”。 当 然 ， 如 有 果 故 意 不 遵循 此 惯例 ， 也 未 答 不 
可 ,但 是 ， 会 给 别人 阅读 乃至 于 自己 以 后 阅读 带 来 磋 烦 ， 不 要 起 记 “ 代 
码 通 常 是 给 人 看 的 ， 只 是 偶尔 让 机 恬 执 行 ”。 既 然 大 家 都 是 靠 右 走 的 ， 
你 残 别 非 要 在 路 中 间 睡 觉 了 。 


分 别 以 缩 进 表示 的 束 是 这 个 类 的 内 容 了 。 其 实 那 些 东 西 看 起 来 并 不 阳 
生 一 一 就 是 已 经 学 习 过 的 函数 。 不 过 ， 很 多 程序 员 喜 欢 把 类 里 面 的 函 
数 叫 作 * 方 法 ”， 就 是 上 节 中 说 到 的 对 象 的 方法”。 曾 看 到 有 人 撰文 专 
站 分析 了 “方法 "和 “函数 ”的 区 别 。 但 是 ， 我 倒 古 认为 这 不 重要 ， 重 要 
的 是 类 中 所 谓 “ 方 法 "和 前 面 的 函数 ， 从 数学 角度 看 ， 丝 萤 没 有 区 别 。 
所 以 ， 你 尽 可 以 称 之 为 画 数 。 当 然 ， 奉 听 到 有 人 说 方法 ， 也 不 要 诺 异 
和 糊涂 ， 它 们 本 质 十 一 样 的 。 


需要 再 次 提醒 ， 函 数 的 命名 方法 是 以 def 发 起 ， 并 且 函 数 名 称 首 字母 不 
0 0 


要 注意 的 是 ， 类 中 的 函数 (方法 ) 的 参数 跟 以 往 的 参数 样式 有 区 别 ， 
那 束 是 每 个 芳 数 必须 包括 self 参 数 ， 并 且 作 为 默认 的 第 一 个 参数 ， 这 是 
需要 注意 的 地 方 。 至 于 它 的 用 途 ， 继 续 学 习 即 可 知道 。 


(3) 初始 化 


def _init_ 这 个 函数 一 个 比较 特殊 ， 并 且 有 一 个 名 字 ， 叫 作 和 初始化 画 
数 (注意 ， 很 多 教材 和 资料 中 把 它 叫 作 构造 画 数 ， 这 种 说 法 貌似 没有 
普 误 ， 但 是 从 字面 意义 上 看 ， 它 对 应 的 含义 是 初始 化 ， 而 且 在 Python 
中 它 的 作用 和 其 他 语言 比 还 不 完全 一 样 ， 因 为 还 有 一 个 _new_ 的 函 
数 是 真正 的 构造 。 所 以 ， 我 称 之 为 初始 化 函数 ) 。 它 是 以 两 个 下 画 线 
开始 ， 然 后 是 init， 最 后 以 两 个 下 画 线 结束 。 


所 谓 初 始 化 ， 就 是 让 类 有 一 个 基本 的 面貌 。 做 很 多 事情 都 要 初始 化 ， 
让 事情 有 一 个 具体 的 起 点 状态 。 比 如 你 要 喝 水 ， 必 须 先 初始 化 杯子 里 
面 有 水 。 在 Python 的 类 中 ， 初 始 化 殉 担 负 首 类似 的 工作 。 这 个 工作 是 
在 类 被 实例 化 的 时 候 就 执行 这 个 钞 数 ， 从 而 将 初始 化 的 一 些 属性 可 以 
放 到 这 个 函数 里 面 。 


此 例子 中 的 初始 化 钞 数 就 意味 闭 实例 化 的 上 时候， 要 给 参数 name 提 供 一 
个 值 ， 作 为 类 初始 化 的 内 容 。 束 是 在 这 个 类 被 实例 化 的 同时 ， 要 通过 
name 参 数 传 一 个 值 ， 这 个 值 被 一 开始 束 写 入 了 类 和 实例 中 ， 成 为 了 类 
和 实例 的 一 个 属性 。 比 如 : 


girl = Person('canglaoshi') 


girl 是 一 个 实例 对 象 ， 它 有 属性 和 方法 ， 这 里 仅 说 属性 吧 。 当 通过 上 面 
束 目 动 执行 了 初始 化 画 数 ， 让 实例 ginl 束 具有 了 
name 嘻 性。 


执行 这 句 话 的 结果 是 打印 出 canglaoshi。 


这 束 是 初始 化 的 功能 。 人 簿 而 言 之 ， 通 过 初始 化 函数 ， 确 定 了 这 个 实例 
(类 ) 的 “基本 属性 ”。 
初始 化 钞 数 束 是 一 个 画 数 ， 所 以 ， 它 的 参数 设置 也 符合 前 面 学 过 的 画 
数 参 数 设置 规范 。 比 如 : 


def _ init_ (self, *args): 


pass 


这 种 类 型 的 参数 *args 和 前 面 讲述 的 函数 参数 一 样 ，self 这 个 参数 是 必 
须要 有 的 。 


很 多 时 候 ， 并 不 是 每 次 都 要 从 外 面 传 入 数据 ， 有 时 候 会 把 初始 化 函数 
人 如 果 没 有 新 的 数据 传 入 ， 或 应 用 这 些 默 认 
。 比如 : 


Self.website = website 


self.email = "qiwsir@gmail.com" 


laogqi = Person("LaoQi") 


info = Person("qiwsir", lang="python", website="qiwsir.github.io") 


print "laoqgi.name=", laoqi.name 
print "info.name=", info.name 

print "------- 和 

print "laoqi.lang=", laoqi.lang 

print "info.lang=", info.lang 

print "------- 

print "laoqi.website=", laoqi.website 
print "info.website=", info.website 


元 征 疆 
运行 结 
laogqi.name= LaoQi 
info.name= qiwsir 
laoqi.lang= golang 
info.lang= python 
laoqi.website= www.google.com 


info.website= qiwsir.github.io 


在 编程 只 有 这 样 一 句 话 : “类 是 实例 工厂 ”， 什 么 意思 呢 ? 生产 物品 ， 
比如 生产 电脑 ， 一 个 工厂 可 以 生产 好 多 电脑 ， 那 么 ， 类 就 能 “生产 ”好 
多 实例 ， 所 以 ， 它 是 “工厂 ”。 比 如 上 面 例子 中 ， 就 有 两 个 实例 。 


4.2.3 类 中 的 函数 (方法 ) 

这 里 我 用 “函数 ”这 个 术语 ， 指 的 是 类 中 的 那些 函数 ， 也 把 它 叫 作 “ 方 
法 ”。 但 是 这 里 不 打算 太 深 入 区 分 “方法 ”和 “ 范 数 ”"， 因 为 随 着 读者 对 编 
程 的 熟悉 ， 上 自然 能 领情 到。 所 以 ， 我 可 能 在 有 的 地 方 承接 原来 的 习惯 
用 “ 画 数 "， 也 可 能 用 “方法 ”。 


再 把 已 经 用 过 的 那个 类 拿 出 来 研究 一 番 。 


#!/usr/bin/env python 


# coding=utf-8 


_ metaclass = type 


def getName(self): 


return self.name 


def color(self, color): 


print "%s is %s" % (self.name, color) 


构造 函数 的 后 面 有 两 个 函数 : def getName (self) 和 def color (self， 
人 和 都 是 以 self 作 
J 第 一 个 参数 。 


def getName(self): 


return self.name 


这 个 函数 的 作用 就 是 返回 在 初始 化 时 得 到 的 值 ， 初 始 化 函数 中 
self.name 的 值 能 够 在 这 个 函数 中 被 使 用 ， 其 原因 就 在 于 此 函数 中 不 可 
缺少 的 参数 self。 


girl = Person('canglaoshi') 


name = girl.getName() 


girl.getName0) 就 是 调用 实例 gil 的 getName() 方 法 〈 函 数 ) 。 调 用 该 方 
法 的 时 候 要 特别 注意 ， 方 法 名 后 面 的 括号 不 可 少 ， 并 且 括 号 中 不 要 写 
参数 ， 在 类 中 的 getName (self) 函数 第 一 个 参数 self 是 默认 的 ， 当 类 实 
例 化 之 后 ， 调 用 此 函数 的 时 候 ， 第 一 个 参数 不 需要 赋值 。 那 么 ， 变 量 


name 的 最 终结 果 就 是 name="canglaoshi"。 


同样 道理 ， 对 于 方法 : 


def color(self, color): 


print "%s is %s" % (self.name, color) 


也 是 在 实例 化 之 后 调用 : 


girl.color("white") 


这 也 是 在 执行 实例 化 方法 ， 只 是 由 于 类 中 的 该 方法 有 两 个 参数 ， 除 了 
默认 的 self 之 外 ， 还 有 一 个 color， 所 以 ， 在 调用 这 个 方法 的 时 候 ， 要 为 


后 面 那 个 参数 传 值 。 


至 此 ， 已 经 将 这 个 典型 的 类 和 调用 方法 分 解 完毕 ， 
出 ， 请 读者 从 头 到 尾 看 看 ， 是 否 理解 了 每 个 部 分 的 含义 : 


#!/usr/bin/env python 


# coding=utf-8 


_ metaclass _ = type 


class Person: 


def _ init (self, name): 


self.name = name 


def getName(self): 


return self.name 


def color(self, color): 


把 全 


print "%s is %s" % (self.name, color) 


girl = Person('canglaoshi') 
name = girl.getName() 

print "the person's name is: ", name 
girl.color("white") 

print "------ 
print girl.name 
保存 后 ， 运 行 得 到 如 下 结果 : 
$ python 20701.py 
the person's name is: canglaoshi 
canglaoshi is white 


canglaoshi 


4.2.4 类 和 实例 


# 实 例 化 
# 调 用 方法 (函数 ) 


# 调 用 方法 (函数) 


# 实 例 的 属 1 


从 


有 必要 总 结 一 下 类 和 实例 的 关系 。 


(1)“ 类 提供 默认 行为 ， 是 实例 的 工厂 ”( 源 自 Learning Python) ， 这 
句 话 非 常 经 典 ， 一 下 道破 了 类 和 实例 的 天 系 。 所 谓 工厂 ， 束 是 可 以 用 
同一 个 模子 做 出 很 多 具体 的 产品 。 类 吏 是 那个 模子 ， 实 例 就 是 具体 的 
产品 。 所 以 ， 实 例 是 程序 处 理 的 实际 对 象 。 


部 代码 完整 贴 


(2) 类 由 一 些 语句 组 成 ， 但 是 实例 通过 调用 类 生成 ， 每 次 调用 一 个 
类 ， 束 得 到 这 个 类 的 新 的 实例 。 


(3) 命名 类 必须 用 class， 例 如 class Person。Class 发 起 了 一 个 可 执行 的 
语句 ， 如 果 执 行 ， 束 得 到 一 个 类 对 象 ， 并 且 将 这 个 类 对 象 赋 值 给 对 象 
名 (比如 Person) 。 


也 许 上 述 比 较 还 不 足以 让 你 把 类 和 实例 理解 透彻 ， 没 关系 ， 继 续 学 
习 ， 在 前 进 中 排除 疑惑 。 


4.2.5 ”self 的 作用 


类 里 面 的 函数 ， 第 一 个 参数 是 self， 而 且 不 能 省 略 。 但 是 在 实例 化 的 时 
候 ， 这 个 参数 不 需要 写 ， 也 不 需要 为 这 个 参数 传 值 ， 似 乎 没有 这 个 参 
数 什么 事 儿 了 ， 真 的 是 这 样 吗 ? self 征 干什么 的 呢 ? 


self 征 一 个 很 神奇 的 参数 。 


还 是 以 前 面 的 类 “Person” 为 例 ， 在 Person 实 例 化 的 过 程 中 girl=Person 

("canglaoshi") ， 字 符 串 "canglaoshi" 通 过 初始 化 函数 (init_0) 的 
参数 已 经 存 入 到 内 存 中 ， 并 且 以 Person 类 型 的 面貌 存在 ， 组 成 了 一 个 
对 象 ， 这 个 对 象 和 变量 girl 建 立 引 用 关系 。 这 个 过 程 也 可 说 成 这 些 数据 
附加 到 一 个 实例 上 。 这 样 就 能 够 以 object.attribute 的 形式 ， 在 程序 中 任 
何 地 方 调用 某 个 对 象 数据) 。 例 如 上 面 的 程序 中 以 girl.name 的 方式 
得 到 "canglaoshi"。 这 种 调用 方式 ， 在 类 和 实例 中 经 常 使 用 ， 点 号 “.” 后 
面 的 称 之 为 类 或 者 实例 的 属性 。 


这 征 在 程序 中 ， 并 且 是 在 类 的 外 面 。 如 采 在 类 的 里 面 ， 想 在 茶 个 地 方 
使 用 实例 化 所 传 入 的 数据 ("canglaoshi") ， 怎 么 办 ? 


在 类 内 部 ， 束 是 将 所 有 传 入 的 数据 都 同 给 一 个 变量 ， 通 第 这 个 变量 的 
名 字 有 是 self。 注 意 ， 这 是 习惯 ， 而 且 是 共识 ， 所 以 ， 你 吏 不 要 费 尽 心机 
另外 取 别 的 名 字 了 。 


在 初始 化 函数 中 的 第 一 个 参数 self 束 是 起 到 了 这 个 作用 一 一 接收 实例 化 
过 程 中 传 入 的 所 有 数据 ， 这 些 数 据 是 初始 化 函数 的 参数 导入 的 。 显 
然 ，self 应 该 就 是 一 个 实例 (准确 说 法 是 应 用 实例 ) ， 因 为 它 所 对 应 的 
就 是 具体 数据 。 


如 条 将 上 面 的 类 稍 加 修改 ， 看 看 效果 : 


#!/usr/bin/env python 


# coding=utf-8 


print self 


print type(self) 


其 他 部 分 省 略 。 当 初始 化 的 时 候 ， 首 先 要 运行 构造 国 数 ， 同 时 打印 新 
增 的 两 条 。 结 果 是 : 


<_ main__.Person object at 90xb7282cec> 


<class '__ main__.Person'> 


证 实 了 推理 ，self 就 是 一 个 实例 (准确 说 是 实例 的 引用 变量 ) 


self 这 个 实例 跟前 面 说 的 那个 gil 所 引用 的 实例 对 象 一 样 ， 也 有 属性 。 
那么 ， 接 下 来 束 规 定 其 属性 和 属性 对 应 的 数据 。 上 面 代码 中 : 
self.name=name， 职 是 规定 了 self 实 例 的 一 个 属性 ， 这 个 属性 的 名 字 也 
叫 作 name， 且 属性 的 值 等 于 初始 化 函数 的 参数 name 所 导入 的 数据 。 注 
意 ，selfname 中 的 name 和 初始 化 函数 的 参数 name 没 有 任何 关系， 它们 
两 个 一 样 ， 只 不 过 是 一 种 巧合 〈 经 常 巧 合 ， 其 实 是 为 了 省 事 和 以 后 识 
别 方便 而 故意 让 它们 巧合 ， 或 者 说 是 写 代码 的 人 懒 懈 ， 不 想 男 外 取 名 
字 而 已 ， 无 他 ) 。 当 然 ， 如 果 写 成 self.xyz=name， 也 是 可 以 的 。 


其 实 ， 从 效果 的 角度 来 理解 更 简化 ， 类 的 实例 girl 对 应 着 self，gitl 通 过 
self 导 入 实例 属性 的 所 有 数据 。 


当然 ，self 的 属性 数据 ， 也 不 一 定 非得 由 参数 传 入 ， 也 可 以 在 构造 函数 
中 自己 设 定 。 比 如 : 


#!/usr/bin/env python 


#coding:utf-8 


self.email = "qiwsir@gmail.com" # 这 个 属性 不 是 通过 参数 传 入 的 
info = Person("qiwsir") # 换 个 字符 串 和 实例 化 变量 
p t nfo. e="， f 
p t nfo ail=" f 1 
Me hy /on 
运行 结果 
info. q 
info.email= qiwsir@gmail.com # 打 印 结果 


这 个 例子 让 我 们 拓展 了 对 self 的 认识 ， 它 不 仅仅 是 为 了 在 类 内 部 传递 参 
数 导入 的 数据 ， 还 能 在 初始 化 函数 中 ， 通 过 self.attribute 的 方式 ， 规 定 
self 实 例 对 象 的 属性 ， 这 个 属性 也 是 类 实例 化 对 象 的 属性 ， 即 作为 类 通 
过 初始 化 函数 初始 化 后 所 具有 的 属性 。 所 以 在 实例 info 中 ， 通 过 
info.email 同 样 能 够 得 到 该 属性 的 数据 。 在 这 里 ， 就 可 以 把 self 形 象 地 理 
解 为 “内 外 兼 修 ”了 。 或 者 按照 前 面 所 提 到 的 ， 将 info 和 self 对 应 起 来 ， 
self 主 内 ，info 主 外 。 


4.2.6 ”文档 字符 串 
0 i 同样 ， 在 类 里 面 也 要 写 点 东 


在 函数 里 面 ， 可 以 用 三 重 引 号 来 写 说 明 ， 在 类 中 也 可 以 ， 其 实在 文件 
开头 的 部 分 也 能 用 三 重 引 号 写 文 档 字符 串 说 明 。 这 样 写 的 最 大 好 处 古 
能 够 用 help0) 函 数 看 。 


'""This is python lesson""" 


def start_func(arg): 
"rhis Ls a Tunction, ET 


pass 


class MyClass: 
"""Thi is my class.""" 
def my_method(self,arg): 
"""This is my method."™"" 


pass 


这 样 的 文档 是 必需 的 。 当 然 ， 在 编程 中 ， 有 不 少 地 方 要 用 “护符 号 来 做 


注释 。 


4.3 ”辨析 有 关 概 念 


在 掌握 了 类 的 基本 知识 的 基础 上 ， 对 与 类 有 关 的 儿 个 概念 进行 深入 辨 
析 ， 这 种 辨析 的 目的 在 于 让 读者 对 类 有 更 深入 的 了 解 ， 诚 然 ， 更 需要 
实践 练习 ， 通 过 实践 能 够 深入 感 恒 到 内 在 的 奥秘 。 


4.3.1 类 属性 和 实例 属性 

一 个 类 实例 化 后 ， 实 例 是 一 个 对 象 ， 它 有 属性 。 不 要 环 记 ，Python 中 
的 类 也 十 一 个 对 象 ， 且 也 有 属性 。 所 以 惑 有 了 "类 属性 ?和 “实例 属 
性 ”两 个 属性 。 


lass A(object): 


在 交互 模式 下 ， 定 义 一 个 很 商 单 的 类 ， 类 中 有 一 个 变量 x=7， 当 然 ， 
如 有 果 愿 意 还 可 以 写 得 复杂 点 儿 。 


在 类 A 中 ， 变 量 x 所 引用 的 对 象 ， 能 够 直接 通过 类 调用 。 和 
的 属性 ， 这 束 是 所 谓 的 “类 属性 ”。 类 属性 仅 限 于 出 J 变 量 还 
有 另外 的 称呼 ， 如 静态 数据 。 


>>> foo = A() 
>>> foo.x 


将 类 A 实例 化 ， 遂 过 实例 foo 也 可 以 得 到 属性 (foo.x) ， 这 个 属性 叫 
作 “ 实 例 属性 ” 


对 于 同一 属性 ， 可 以 用 类 来 访问 (类 属性 ) ， 在 一 般 情 况 下 ， 也 可 以 
通过 实例 来 访问 同样 的 属性 。 


全 I 区 别 。 相 同 的 地 方 好 理解 ， 关 键 是 区 别 才 是 编程 中 要 
注意 


实例 属性 (foo.x) 更 新 了 ， 类 属性 (A.x) 没有 改变 。 这 至 少 说 明 ， 
类 属性 不 会 被 实例 属性 左右 ， 也 可 以 进一步 说 明 “ 类 属性 与 实例 属性 无 
天 ” (这 人 句 话 不 能 理解 为 “类 属性 "和 “实例 属性 ” 互 不 相关 ， 如 果 要 这 入 
理解 ， 按 照 更 挛 格 的 逻辑 ， 应 该 还 要 看 看 修改 A.x 变 化 是否 影响 到 


foo.x) 。 
那么 ，foo.x+=1 的 本 质 是 什么 呢 ? 


其 本 质 是 实例 foo 又 建立 了 一 个 新 的 属性 ， 但 是 这 个 属性 (新 的 foo.x) 
居然 与 原来 的 属性 〈 旧 的 foo.x) 重 名 ， 所 以 ， 原 来 的 foo.x 就 被 “遮盖 
了 ”只 能 访问 到 新 的 foo.x， 它 的 值 是 8。 既然 新 的 foo.x“ 氮 盖 ” 了 旧 的 
foo.x， 如 果 删 除 它 ， 旧 的 束 会 显现 出 来 。 


的 确 是 这 样 ， 删 除 新 的 foo.x 之 后 ， 被 它 窗 六 的 foo.x 值 束 显 示 出 来 了 。 


此 外 ， 还 可 以 通过 建立 一 个 不 与 旧 的 实例 属性 重 名 的 实例 属性 ， 理 解 
上 述 过 程 。 


foo.y 束 是 新 建 的 一 个 实例 属性 ， 它 没有 影响 原来 的 实例 属性 foo.x 。 


前 面 看 到 了 实例 属性 不 左右 类 属性 ， 反 过 来 ， 类 属性 能 否 影 响 实例 属 
性 呢 ? 这 点 似 乎 应 该 好 解释 ， 因 为 实例 束 古 通过 实例 化 类 实现 的 ， 按 
照 推理 ， 实 例 属性 应 该 受到 类 属性 的 影响 。 


>>> A.x += 1 
>>> A.x 

8 

>>> foo.x 


实例 属性 的 值 随 看 类 属性 的 值 变 化 而 改变 了 。 


综 上 ,“ 类 属性 不 受 实例 属性 影响 ， 但 实例 属性 受到 类 属性 左右 ”， 不 
过 ， 这 个 结论 是 有 条 件 的 ， 前 面 例子 中 类 内 的 变量 应 用 的 是 不 可 变 对 
象 整数) 。 根 据 对 可 变 对 象 和 不 可 变 对 象 的 研究 经 验 (可 以 参考 浅 
拷贝 和 深 搁 贝 ) ， 按 照 保 守 主 义 的 原则 (什么 是 保守 主义 ? 保守 不 等 
于 守旧 ， 其 他 的 含义 ， 读 者 可 以 查阅 有 关 书 籍 资 料 。) ， 还 应 该 考察 
人 
-可 SN 


>>> class B(object ) : 


y = [1，2，3] 


这 次 定义 的 类 中 ， 变 量 引 用 的 古 一 个 可 变 对 象 一 一 列表 。 


从 上 面 的 比较 操作 中 ， 你 能 得 出 什么 结论 ? 当 类 中 变量 引用 的 是 可 变 
人 ， 类 属性 和 实例 属性 都 能 直接 修改 这 个 对 象 ， 从 而 影响 男 一 方 
以 保守 主义 为 原则 的 思维 方法 胜利 了 。 


继续 看 类 属性 和 实例 属性 的 区 别 。 


>>> foo = A() 


>>> dir(foo) 


六 init _', '__modu 
1 Str , * subclasshook 


#4 同时 在 实例 属性 中 也 增加 了 一 样 的 名 称 和 数据 的 属 


反 过 来 ， 如 果 增 加 实例 属性 ， 会 不 会 也 同时 增加 一 个 类 属性 呢 ? 


>>> foo.z = "python" 

>>> foo.z 

'python' 

x A 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


AttributeError: type object 'A' has no attribute 'z' 


类 并 没有 收纳 通过 实例 增加 的 这 个 属性 ， 这 进一步 说 明 ， 类 属性 不 受 
实例 属性 左右 。 

不 管 是 通过 类 ， 还 是 通过 实例 ， 都 可 以 增加 和 修改 属性 ， 其 方法 就 是 
通过 类 或 者 实例 的 点 号 操作 来 实现 ， 即 object.attribute， 可 以 实现 对 属 
性 的 修改 和 增加 。 


4.3.2 ”数据 流转 


在 类 的 应 用 中 ， 最 广泛 的 是 将 类 实例 化 ， 通 过 实例 来 执行 各 种 方法 
( 即 类 里 面 的 画 数 ) 。 所 以 ， 对 此 过 程 中 的 数据 流转 一 定 要 弄 明 白 。 


还 是 回 到 前 面 让 你 兴趣 一 然 的 那个 实例 ， 只 做 适当 修改 ， 
出 "canglaoshi"。 这 里 将 注释 删除 ， 读 者 是 否 能 够 写 上 必要 的 注释 呢 ? 
如 有 果 你 能 把 注释 写 上 ， 束 说 明 已 经 理解 了 类 的 基本 结构 。 


#!/usr/bin/env python 


# coding=utf-8 
_ metaclass = type 


class Person: 
def _ init_ (self, name): 


self.name = name 


def getName(self): 


return self.name 


def breast(self, n): 


self.breast = n 


def color(self, color): 


print "%s is %s" % (self.name, color) 


def how(self): 


print "%s breast is %s" % (self.name, self.breast) 


girl = Person('canglaoshi') 


girl.breast(90) 


girl.color("white") 


girl.how() 


运行 后 结 采 : 


$ python 20701.py 
canglaoshi is white 


canglaoshi breast is 90 


一 图 胜 千 言 ， 有 图 有 真相 。 通 过 图 示 ， 我 们 看 一 看 数据 的 流转 过 程 ， 
如 图 4-1 所 示 。 


class Person: 
def _ init (self, name): 
seLf.nar 明 = name 


def getNanme(self): 
returmn Bei .name 


def breasitt (self, Ny 
sglf.breast = n 


def coLorl(seLf， 


print "%s %s"|% (SEW name, color) 


def howl(selfy: 
print "9 reast| is %s"” % (self.name, self.breast) 


girl = Personk'c glaoshi') 
girl.breast(90) 


girl.color("white") 
girl.how() 


图 4-1 ”数据 的 流转 过 程 


创建 实例 girl=Person (canglaoshi) ， 注 意 观察 图 上 的 箭头 方向 。ginl 
这 个 实例 和 Person 类 中 的 self 对 应 ， 这 正 是 应 了 上 节 所 概括 的 “实例 变 
量 与 Self 对应， 实例 变量 主 外 ，self 主 内 ”的 结论 。"canglaoshi" 是 一 个 具 
体 的 数据 ， 通 过 初始 化 函数 中 的 name 参 数 ， 传 给 selfname， 你 应 已 知 
self 也 是 一 个 实例 ， 可 以 为 它 设 置 属性 ，self.name 就 是 一 个 属性 ， 经 过 
初始 化 函数 ， 这 个 属性 的 值 由 参数 name 传 入 ， 现 在 束 是 "canglaoshi"。 


在 类 Person 的 其 他 方法 中 ， 都 是 以 self 为 第 一 个 或 者 唯一 一 个 参数 。 注 
意 ， 在 Python 中 ， 这 个 参数 要 显明 写 上 ， 在 类 内 部 的 函数 的 参数 中 是 
不 能 省 略 的 。 这 整 表 示 所 有 方法 都 继承 self 实 例 对 象 ， 它 的 属性 也 被 市 
到 每 个 函数 之 中 。 例 如 在 其 他 函数 里 面 使 用 self.name 即 是 调用 前 面 已 
经 确定 的 实例 属性 数据 。 当 然 ， 在 函数 中 ， 还 可 以 继续 为 实例 self 增 加 
， 比如 self.breast。 这 样 ， 通 过 self 实 例 ， 就 实现 了 数据 在 类 内 部 的 
流转 。 


如 果 要 把 数据 从 类 里 面 传 到 外 面 ， 可 以 通过 return 语 名 实现。 如 上 面 例 
子 中 所 示 的 getName 方 法 。 


实例 名 称 girl 和 self 是 对 应 关系 ， 实 际 上 ， 在 类 里 面 也 可 以 用 girl 代替 
self。 例 如 ， 做 如 下 修改 : 


#!/usr/bin/env python 


# coding=utf-8 


_ metaclass = type 


class Person: 


def _ init__(self, name): 


self.name = name 


def getName(self): 


#return self.name 


return girl.name # 修 改 成 这 样 ， 但 是 在 编程 实践 中 不 要 这 么 做 。 


girl = Person('canglaoshi') 
name = girl.getName() 


print name 


运行 之 后 ， 打 印 : 


canglaoshi 


这 个 例子 说 明 ， 在 实例 化 之 后 ， 实 例 变量 gil 和 画 数 里 面 的 self 实 例 是 
完全 对 应 的 。 但 是 ， 千 万 不 要 用 上 面 修改 的 方式 ， 因 为 那样 写 使 类 没 
有 独立 性 ， 这 是 大 忌 。 


4.3.3 ”命名 衬 间 


命名 空间 (namespaces) ， 在 人 研究 类 或 者 面向 对 象 编程 中 ， 它 常常 被 
提 到 。 虽 然 在 函数 那 部 分 已 经 对 命名 空间 有 初步 解释 ， 但 那 是 在 函数 
的 知识 范畴 中 的 理解 。 现 在 ， 我 们 在 类 的 知识 范畴 中 理解 “类 命名 空 
间 ”* 一 一 定义 类 时 ， 所 有 位 于 class 语 句 中 的 代码 都 在 某 个 命名 空间 中 执 
行 ， 即 类 命名 空间 。 


以 前 ， 请 打开 Python 的 交互 模式 ， 输 入 import this， 可 
以 看 到 : 


>>> import this 


The Zen of Python, by Tim Peters 


Beautiful is better than ugly. 
Explicit is better than implicit. 
Simple is better than complex. 


Complex is better than complicated. 


Flat is better than nested . 

Sparse is better than dense. 

Readability counts. 

Special cases aren't special enough to break the rules. 

Although practicality beats purity. 

Errors should never pass silently. 

Unless explicitly silenced. 

In the face of ambiguity, refuse the temptation to guess. 

There should be one-- and preferably only one --obvious way to do it. 
Although that way may not be obvious at first unless you're Dutch. 
Now is better than never 

Although never is often better than *right* now. 


If the implementation is hard to explain, it's a bad idea. 


If the implementation is easy to explain, it may be a good idea. 


Namespaces are one honking great idea -- let's do more of those! 


这 就 是 所 请 的 《Python 之 禅 》， 请 看 最 后 一 句 “Namespaces are one 
honking great idea--let's do more of those ! ”， 一 般 情 况 下 ， 最 后 一 句 都 
征 比较 重要 的 。 比 如 有 人 做 讲座 ， 一 大 堆 PPT 一 页 一 页 地 播放 着， 口 
中 念 念 有 词 ， 或 许 对 你 都 没有 什么 用 途 ， 但 是 当 他 说 出 “谢谢 聆听 ”这 
句 话 的 时 候 ， 你 一 定 会 从 仁 借 沉沉 中 请 本 过 来 ， 因 为 他 说 了 最 后 一 
句 ， 标 志 着 演说 结束 。 所 以 ， 千 万 要 认真 听 最 后 一 句 呀 。 


在 最 后 一 句 中 说 到 了 Namespaces， 可 见 命名 空间 的 重 


把 已 经 阐述 过 的 命名 空间 用 一 句 比 较 学 术 化 的 语言 概括 : 命名 空间 是 
从 所 定义 的 命名 到 对 象 的 映射 集合 。 


不 同 的 命名 空间 可 以 同时 存在 ， 彼 此 相互 独立 互 不 干扰 。 
命名 空间 因为 对 象 的 不 同 也 有 所 区 别 ， 可 以 分 为 如 下 几 种 。 


(1) 内 置 命名 空间 (Built-in Namespaces) : Python 运行 起 来 ， 它 们 
瓯 存在 了 。 内 置 函 数 的 命名 空间 都 属于 内 置 命名 空间 ， 所 以 ， 我 们 可 
以 在 任何 程序 中 直接 运行 它们 ， 比 如 前 面 的 idO0， 不 需要 做 什么 操作 ， 
拿 过 来 丈 能 直接 使 用 。 


(2) 全 局 命名 空间 (Module:Global Namespaces) : 每 个 模块 创建 它 
目 己 所 拥有 的 全 局 命名 空间 ， 不 同 模 块 的 全 局 命名 空间 彼此 独立 ， 不 
同 模块 中 相同 名 称 的 命名 空间 ， 也 会 因为 模块 的 不 同 而 不 相互 干扰 。 


(3) 本 地 命名 空间 (Function&Class:Local Namespaces) : 模块 中 有 
函数 或 者 类 ， 每 个 函数 或 者 类 所 定义 的 命名 空间 束 是 本 地 命名 空间 。 
如 有 果 豆 数 返 回 了 结果 或 者 抛 出 异常 ， 则 本 地 命名 空间 也 结束 了 。 

如 图 4-2 所 示 ， 展 示 一 下 上 述 三 种 命名 空间 的 关系 。 
程序 在 查询 上 述 三 种 命名 空间 的 时 候 ， 按 照 从 里 到 外 的 顺序 ， 即 : 


Local Namespaces 一 Global Namesspaces 一 Built-in Namesspaces ° 


>>> def foo(num, str) 
ame = "qiwsir" 


print locals() 


>>> foo(221, "qiwsir.github.io") 


{'num': 221, 'name': 'qiwsir', 'str': 'qiwsir.github.io'} 


内 置 命名 空间 


全 局 命名 空间 


本 地 命名 空间 


图 4-2 三 种 命名 空间 的 关系 


这 是 一 个 访问 本 地 命名 空间 的 方法 ， 用 print locals() 完 成 ， 从 这 个 结果 
I ` 难 看 出 ， 所 请 的 命名 空 = 间 候 的 数据 存储 结构 条 dictionaty 是 一 样 


根据 习惯 ， 如 果 访 问 全 局 命名 空间 ， 可 以 使 用 print globals0。 
4.3.4 ”作用 域 


作用 域 是 指 Python 程序 可 以 直接 访问 到 的 命名 空间 。“ 和 直接 访 问 ?在 这 
意味 着 访问 命名 空间 中 的 命名 时 无 须 加 入 附加 的 修饰 符 。 


ee 空间 的 顺序 ， 搜 索 相 应 空间 的 能 够 访问 到 的 作 


def outer_foo(): 


b = 20 
def inner_foo(): 
c= 30 


a = 10 


假如 我 现在 位 于 inner_foo0 函 数 内 ， 那 么 c 对 我 来 讲 就 在 本 地 作用 域 ， 

而 b 和 a 就 不 是 。 如 果 我 在 inner_foo0 内 再 做 : b=50， 这 其 实 是 在 本 地 

nn 内 新 创建 了 对 象 ， 和 上 一 层 中 的 b=20 坚 不 相干 。 可 以 看 下 面 
例子: 


#!/usr/bin/env python 


#coding:utf-8 


def outer_foo(): 


如 琳 要 将 菏 个 变量 在 任何 地 方 都 使 用 ， 且 能 够 关联， 那么 在 函数 内 束 
使 用 global 声 明 ， 其 实 束 是 曾经 讲 过 的 全 局 变量 。 


4.4 继承 


继承 是 非常 重要 的 ， 因 为 继承 让 我 们 能 够 延续 以 前 的 东西 ， 比 如 *“ 龙 生 
龙 、 凤 生 凤 、 老 鼠 的 儿子 会 打 洞 ?十 基因 继承 结 有 末 ， 除 了 生物 方面 的 继 
承 ， 在 现实 生活 中 ,， “继承 ”意味 着 一 个 人 从 另外 一 个 人 那里 得 到 了 一 
些 什么 ， 比 如 继承 单 命 先烈 的 光 采 传统 等 。 总 之 , “继承 ”之 后 ， 目 己 
忠 在 所 继承 的 方面 省 力气 ， 不 用 劳 神 费心 束 能 轻松 得 到 。 


但 是 ， 高 级 编程 语言 中 的 “继承 ”， 跟 通常 理解 的 继承 会 有 所 不 同 。“ 继 
承 ” 在 高 级 编程 语言 中 是 一 个 非常 重要 的 概念 。 虽 然 不 用 继承 一 样 能 够 
但 是 ， 当 我 们 退 求 程序 的 更 高 阶层 时 ， 继 承 的 作用 就 显现 


继承 (Inheritance) 是 面向 对 象 软件 技术 当中 的 一 个 概念 。 如 果 一 个 类 
别 A“ 继 承 ”" 目 男 一 个 类 别 B， 殊 把 这 个 A 称 为 唱 的 子 类 别 *”， 而 把 B 称 
为 “A 的 父 类 别 *”， 也 可 以 称 “B 十 A 的 超 类 ”。 


继承 可 以 使 得 子 类 别 具 有 父 类 别 的 各 种 属性 和 方法 ， 而 不 需要 再 次 编 
写 相同 的 代码 。 在 令 子 类 别 继承 父 类 别 的 同时 ， 可 以 重新 定义 某 些 属 
性 ， 并 重 写 某 些 方法 ， 即 窗 蓄 父 类 别 的 原 有 属性 和 方法 ， 使 其 获得 与 
父 类 别 不 同 的 功能 。 另 外 ， 为 子 类 别 追 加 新 的 属性 和 方法 也 是 前 见 的 
做 法 。 《〈 源 自 维基 百科 ) 


由 上 面 对 继 承 的 表述 ， 简 单 总 结 出 继承 的 意图 或 者 好 处 : 
和 但 不 是 仅仅 实现 代码 重用 ， 有 时 候 根 本 殉 没 


(2) 实现 属性 和 方法 继承 。 


诚然 ， 以 上 也 不 是 全 部 ， 随 大 后 壬 学 习 ， 对 继承 的 认识 会 更 深刻 。 好 
友 “ 令 狐 虫 "曾经 这 样 总 结 继承 : 


从 技术 上 说 ，OOP 里 继承 最 主要 的 用 途 是 实现 多 态 。 对 于 多 态 而 言 ， 
重要 的 是 接口 继承 性 ， 属 性 和 行为 是 否 存在 继承 性 ， 这 是 不 一 定 的 。 
事实 上 ， 大 量 工程 实践 表明 ， 重 度 的 行为 继承 会 导致 系统 过 度 复 杂 和 
脐 肿 ， 反 而 会 降低 灵活 性 。 因 此 现在 比较 提倡 的 是 基于 接口 的 轻 度 继 
承 理念 。 这 种 模型 里 因为 父 类 (接口 类 ) 完全 没有 代码 ， 因 此 根本 谈 
不 上 什么 代码 复 用 。 


在 Python 里 ， 因 为 存在 Duck Type， 接 口 定 义 的 重要 性 大 大 降低 ， 继 承 
的 作用 也 进一步 被 削弱 了 。 


从 逻辑 上 说 ， 继 承 的 目的 也 不 是 为 了 复 用 代码 ， 而 是 为 了 理 顺 


或 许 读者 感觉 比较 高 深 , 没关系， 随 着 你 对 实践 经 验 的 积 索 ， 也 能 对 
这 个 问题 有 目 己 独到 的 见解 。 


或 许 你 也 要 问 我 的 观点 是 什么 ， 我 的 观点 就 是 ， 走 着 歇 ! 怎么 理解? 
继续 向 下 看 ， 只 有 你 先 深入 这 个 问题 ， 才 能 跳 到 更 高 层 看 这 个 问题 。 
小 号 过 河 的 故事 还 记得 吧 ? 只 有 素 自 起 入 河水 中 ， 才 知道 河水 的 深 
伐 “ 


对 于 Python 中 的 继承 ， 前 面 一 直 在 使 用 ， 那 焉 是 我 们 写 的 类 都 是 新 式 
类 ， 所 有 新 式 类 都 钙 继 承 目 object 类 。 不 要 起 记 ， 新 式 类 的 一 种 写法 : 


class NewSstyle(object): 


这 束 是 典型 的 继承 。 
4.4.1 基本 概念 
在 编辑 天 中 把 这 些 代码 殴 出 来 。 


#!/usr/bin/env python 


# coding=utf-8 


def speak(self): 


print "I love you." 


def setHeight(self): 


print "The height is: 1.60m." 


O 
he 
» 


ss Girl(Person): 


def setHeight(self): 


print "The height is:1.70m ." 


if name. 


cang = Girl() 
cang.setHeight() 
cang.speak() 


cang.breast(90) 


上 面 这 个 程序 ， 保 存 之 后 运行 : 


$ python 20901.py 
The height is:1.7gm . 
I love you. 


对 以 上 程序 进行 解释 ， 从 中 体会 继承 的 概念 和 方法 。 


首先 定义 了 一 个 类 Person， 在 这 个 类 中 定义 了 三 个 方法 。 注 意 ， 没 有 
定义 初始 化 画 数 ， 初 始 化 画 数 在 类 中 不 是 必须 的 。 


然后 义 定义 了 一 个 类 girl， 这 个 类 的 名 字 后 面 的 括号 中 是 上 一 个 类 的 名 
字 ， 这 就 意味 着 girl 继 承 了 Person，girl 是 Person 的 子 类 ，Person 是 gitl 的 


既然 是 继承 了 Person， 那 么 girl 就 拥有 了 Person 中 的 全 部 方法 和 属性 
LUFE 面 的 例子 没有 列 出 属性 ) 。 人 但是， 如果 girl 里 面 有 一 个 和 Person 同 
样 名 称 的 方法 ， 那 么 就 把 Person 中 的 同一 个 方法 遮盖 住 了 ， 显 示 的 是 
girl 中 的 方法 ， 这 叫 作 方法 的 重 写 。 


实例 化 类 gil 之 后 ， 执 行 实例 方法 cang.setHeightO0， 由 于 在 类 girl 中 重 写 
了 setHeight 方 法 ， 那 么 Person 中 的 那个 方法 残 不 显 作 用 了 ， 在 这 个 实 
例 方法 中 执行 的 是 类 gitl 中 的 setHeight 方 法 。 

虽然 在 类 girl 中 没有 看 到 speak 方 法 ， 但 是 因为 它 继 承 了 Person， 所 以 
cang.speak0 〇 就 执行 类 Person 中 的 方法 。 同 理 cang.breast (90) ， 它 们 就 
好 像 是 在 类 gitl 里 面 已 经 写 了 这 两 个 方法 一 样 。 


4.4.2 多重 继 承 


目 旋 八 。 


WN 
比如 : 


#!/usr/bin/env python 


# coding=utf-8 
_ metaclass = type 


class Person: 
def eye(Self) : 


print "two eyes" 


def breast(self, n): 


print "The breast is: ",n 


class Girl: 
age = 28 
def color(self): 


print "The girl is white" 


class HotGirl(Person, Girl): 


pass 


if name. == "main__" 


kong = HotGirl() 
kong .eye() 
kong.breast(90) 
kong.color() 


print kong.age 


在 这 个 程序 中 ， 前 面 有 两 个 类 : Person 和 girl， 然 后 第 三 个 类 HotGinl 继 
际 了 这 两 个 类 ， 注 意 观 察 继承 方法 ， 束 是 在 类 的 名 字 后 面 的 括号 中 把 
所 继承 的 两 个 类 的 名 字 写 上 。 但 是 第 三 个 类 中 什么 方法 也 没有 。 
然后 实例 化 类 HotGin， 既 然 继 承 了 上 面 的 两 个 类 ， 那 么 那 两 个 类 的 方 
法 就 都 能 够 拿 过 来 使 用 。 保 存 程序 ， 运 行 一 下 看 看 : 


$ python 20902.py 


two eyes 
The breast is: 90 
The girl is white 


28 


值得 注意 的 是 ， 在 类 girl 中 ， 有 一 个 age=28， 在 对 HotGirl 实 例 化 之 后 ， 
因为 继承 的 原因 ， 这 个 类 属性 也 被 继承 到 HotGirl 中 ， 因 此 通过 实例 属 
性 kong.age 一 样 能 够 得 到 该 数据 。 


所 谓 继承 ， 听 起 来 玄 乎 ， 实 际 上 没有 那么 复 洒 ， 核 心 特 征 古 将 父 类 的 
方法 和 属性 全 部 承接 到 子 类 中 ， 如 采 子 类 重 写 了 父 类 的 方法 ， 束 使 用 
子 类 的 该 方法 ， 父 类 的 方法 被 避雷 。 

4.4.3 多 重 继承 的 顺序 

学 习 多 重 继承 的 顺序 很 有 必要 。 比 如 ， 如 果 一 个 类 继承 了 两 个 父 类 ， 

并 且 两 个 父 类 有 同样 的 方法 或 者 属性 ， 那 么 在 实例 化 子 类 后 ， 调 用 哪 
个 父 类 的 方法 和 属性 呢 ? 编造 一 个 没有 实际 意义 ， 纯 粹 为 了 回答 这 个 
问题 的 程序 ， 体 会 一 下 多 重 继承 的 顺序 。 


#!/usr/bin/env python 


# coding=utf-8 


class K1(object ) : 
def foo(self): 


print "K1-foo" 


class K2(object ) : 

def foo(self) : 
print "K2-foo" 

def bar(self): 


print "K2-bar" 


class J1(K1, K2): 


pass 
class J2(K1i; K2): 
def bar(self): 


print "J2-bar" 


Class C(I1, J2):: 


这 段 代码 ， 保 存 后 运行 : 


$ python 20904.py 


(<class '_ main .CcC'>, <class ' main .J1'>, <class '_ main .J2'>, <class ' main .Ki'>, <class ' main_ _ .K2'>， 
<type 'object'>) 


K1-foo 


J2-bar 


代码 中 的 print C._mro_ 是 要 打印 出 类 的 继承 顺序 。 如 果 要 执行 foo() 
方法 ， 首 先 看 J1， 没有， 看 J]2， 还 没有 ， 看 里面 的 K1， 有 了 就 执 

行 ; 即 C==>J1==>J2==>K1; bar0 也 是 按照 这 个 顺序 ， 在 2 中 束 找 到 
本 


这 种 对 继承 属性 和 方法 搜索 的 顺序 称 之 为 “广度 优先 ”。 


在 新 式 类 中 ， 以 及 python3.x 的 类 中 ， 都 是 按照 “广度 优先 ”原则 搜寻 属 
性 和 方法 的 。 


但 是 ， 在 旧式 类 中 是 按照 “深度 优先 ”的 顺序 的 。 因 为 旧式 类 很 少 被 用 
和 所 以 不 举例 。 读 者 可 以 目 己 模仿 上 面 代码 ， 探 索 旧 式 类 的 “深度 优 
”含义 。 


4.4.4 ”super 落 数 
始 化 函数 的 继承 跟 一 般 方 法 的 继承 还 有 点 不 同 ， 可 以 看 下 面 的 例 


#!/usr/bin/env python 


# coding=utf-8 


def _ init__(self): 


self.height = 160 


def about(self, name): 


print "{} is about {}".format(name, self.height) 


oO 
Hn 


ass Girl(Person): 
def _ init_ (self) : 


Self.breast = 90 


def about(self, name): 


print "{} is a hot girl, she is about {}, and her breast is {}".format(name, self.height, self.breast) 


在 上 面 这 段 程 序 中 ， 类 gil 继承 了 类 Person。 在 类 gil 中 ， 初 始 化 设置 了 
self.breast=90， 由 于 继承 了 Person， 按 照 前 面 的 经 验 ，Person 的 初始 化 
函数 中 的 self.height=160 也 应 该 被 Girl 所 继承 过 来 。 然 后 在 重 写 的 abonut 
方法 中 调用 self.height 。 


实例 化 类 girl， 并 执行 cang.about ("canglaoshi") ， 试 图 打印 出 一 句 话 


canglaoshi is a hot girl, she is about 160, and her bereast is 90。 


保存 程序 ， 运 行 之， 看 看 结 采 是 否 如 所 愿 。 


$ python 20903.py 


Traceback (most recent call last): 

File "20903.py", line 22, in <module> 
cang.about("canglaoshi") 
File "20903.py", line 18, in about 


print "{} is a hot girl, she is about {}, and her breast is {}".format(name, self.height, self.breast) 


AttributeError: 'Girl' object has no attribute 'height"' 


报错 ! 
程序 员 有 一 句 名 言 ， 不 求 最 好 ， 但 求 报 错 。 


Ds 而 是 我 们 长 经 验 的 时 候 ， 是 在 告诉 我 们 ， 那 么 做 不 
对 。 


重要 的 是 看 报错 信息 ， 就 是 我 们 要 打印 的 那 句 话 出 问题 了 ， 报 错 信 息 
I ， 也 束 是 说 类 gil 没有 从 Person 中 继承 过 来 这 
广 属 性。 


原因 是 什么 ? 仔细 观察 类 gil 会 发 现 ， 除 了 刚才 强调 的 about 方 法 重 写 
了 ，_init 方法 也 被 重 写 了 。 不 要 觉得 它 的 名 字模 样 奇 怪 ， 承 不 把 它 
看 作 类 中 的 方法 (函数 ) ， 它 跟 类 Person 中 的 _init 重 名 了 ， 同 样 是 
重 写 了 那个 初始 化 函数 ， 而 girl 中 的 _init_ 中 根本 就 没有 关于 
self.height 的 任何 信息 。 


这 束 提 出 了 一 个 问题 ， 因 为 在 子 类 中 重 写 了 某 个 方法 之 后 ， 父 类 中 同 
样 的 方法 被 收 盖 了 ， 那 么 如 何 再 把 父 类 的 该 方法 调 出 来 使 用 呢 ? 纵 然 
被 但 盖 了 ， 应 该 还 是 存在 的 ， 不 要 浪费 了 呀 。 


Python 中 有 这 样 一 种 被 提倡 的 方法 : super 函数 。 


#!/usr/bin/env python 


# coding=utf-8 
_ metaclass = type 


class Person: 
def _ init (self): 


self.height = 160 


def about(self, name): 


print "{} is about {}".format(name, self.height) 


class Girl(Person): 
def _ init__(self): 
super(Girl, self)._ init __() 


Self.breast = 90 
def about(self, name): 
print "{} is a hot girl, she is about {}, and her breast is {}".format(name, self.height, self.breast) 


super (Girl, self).about(name) 


if name == "main__" 


cang = Girl() 


cang.about("canglaoshi") 


在 子 类 中 ，_init 方法 重 写 了 ,为 了 调用 父 类 同方 法 ， 使 用 super 

(Girl, self) . nL 0 的 方式 opr 数 ， 第 一 个 是 当前 子 类 
的 类 名 字 ， 第 二 个 是 self， 然 后 是 点 号 ， 点 号 后 面 是 所 要 调用 的 父 类 的 
方法 " 同 樟 在 施 类 蛋 窟 的 about 方 法 中 的 及 类 的 about 方 法 。 


执行 结果 : 


$ python 20903.py 


canglaoshi is a hot girl, she is about 160，and her breast is 90 


canglaoshi is about 160 


后 要 注意 : super 范 数 仅仅 适用 于 狐 式 类 。 当 然 ， 你 使 用 的 一 定 是 新 
因为 “ 喜 新 大 旧 ” 是 程序 员 的 嗜好 。 


如 果 你 用 的 是 Python3.x， 则 使 用 super 函 数 的 形式 稍微 不 同 。 怎 么 个 不 
同 呢 ?请 你 认真 阅读 下 面 的 “拓展 阅读 ”中 的 资料 〈 不 要 责备 我 不 说 ， 
我 是 在 告诉 你 一 种 非常 好 的 学 习 方 法 一 一 看 别人 提出 的 问题 和 解答 ， 
因为 那些 问题 也 是 你 的 问题 ) 。 


4.5 方法 

在 前 面 讨论 类 的 时 候 , “方法 "这 个 词语 间或 出 现 ， 并 且 还 说 了 不 用 区 
分 “方法 > 和“ 画 数 ”"， 只 要 知道 所 指 是 什么 就 可 以 了 。 不 过 ， 从 本 节 开 
始 ， 我 们 要 对 糊涂 的 地 方 稍微 澄清 一 下 ， 并 且 对 “方法 "做 个 深入 的 探 
Ea o 


在 程序 中 最 常见 的 是 实例 化 类 ， 通 过 实例 来 调用 类 的 方法 ， 对 以 往 的 
经 验 稍 加 概括 : 


(1) 方法 是 类 内 部 定义 函数 ， 只 不 过 这 个 函数 的 第 一 个 参数 是 self 
(可 以 认为 方法 是 类 属性 ， 但 不 是 实例 属性 ) 。 


(2) 必须 将 类 实例 化 之 后 ， 才 能 通过 实例 调用 该 类 的 方法 。 调 用 的 时 
候 在 方法 后 面 要 有 括号 (括号 中 默认 有 self 参 数 ， 但 是 不 写 出 来 ) 。 


通过 实例 调用 方法 ， 我 们 称 这 个 方法 绑 定 在 实例 上 。 
4.5.1 绑 定 方法 
调用 绑 定 方法 ， 其 实 一 直 在 这 样 做 ， 司 空 见 惯 。 比 如 : 


class Person(object ) : 


def foo(self): 


pass 


如 果 要 调用 Person.foo() 方 法 ， 必 须 : 


pp = Person () # 实 例 化 


pp.foo() 


这 样 加 实现 了 方法 和 实例 的 绑 定 ， 于 是 通过 pp.foo0 即 可 调用 该 方法 。 


4.5.2” 非 绑 定 方法 


还 记得 super 函 数 吗 ? 为 了 描述 方便 ， 把 代码 复制 过 来 : 


#!/usr/bin/env python 


# coding=utf-8 


class Person: 
def _ init_ (self): 


self.height = 160 


def about(self, name): 


print "{} is about {}".format(name, self.height) 


class Girl(Person): 
def _ init_ (self): 
super(Girl, self)._ init_() 


Self.breast = 90 
def about(self, name): 
print "{} is a hot girl, she is about {}, and her breast is {}".format(name, self.height, self.breast) 


super (Girl, self).about(name) 


if name. 


cang = Girl() 


cang.about("canglaoshi") 


在 子 类 girl 中 ， 因 为 重 写 了 父 类 的 _ init 方法 ， 如 果 要 调用 父 类 该 方 
法 ， 不 得 不 使 用 super (Girl，self) ._ init 0 调用 父 类 中 因为 子 类 方法 
重 写 而 被 遮蔽 的 同名 方法 。 


在 子 类 中 ， 父 类 的 方法 吏 是 非 绑 定 方法 ， 因 为 在 子 类 中 ， 没 有 建立 父 
类 的 实例 ， 却 有 要 用 父 类 的 方法 。 对 于 这 种 非 绑 定 方法 的 调用 ， 还 有 一 
种 方式 ， 但 现在 已 经 较 少 使 用 了 ， 因 为 有 了 super 函 数 ， 为 了 方便 读者 
看 其 他 有 关 代 码 ， 还 是 要 简要 说 明 一 下 。 

例如 在 上 面 的 代码 中 ， 在 类 girl 中 想 调用 父 类 Person 的 初始 化 函数 ， 则 
需要 在 子 类 中 写 上 这 么 一 行 : 


Person._ init (self) 


这 不 是 通过 实例 调用 的 ， 而 是 通过 类 Person 实 现 了 对 init (self) 的 
调用 。 这 束 是 调用 非 绑 定 方法 的 用 途 。 但 是 ， 这 种 方法 已 经 被 super 函 


数 取 代 ， 所 以 ， 如 琳 读 者 在 编程 中 直到 类 似 情 况 ， 推 荐 使 用 super 函 


数 。 
4.5.3 静态 方法 和 类 方法 


类 的 方法 第 一 个 参数 必须 是 self， 并 且 如 果 要 调用 类 的 方法 ， 要 通过 类 
的 实例 ， 即 方法 绑 定 实例 后 才能 由 实例 调用 。 如 采 不 绑 定 ， 一 般 在 继 
承 关 系 的 类 之 间 ， 可 以 用 super 芳 数 等 方法 调用 。 


静态 方法 和 类 方法 是 什么 意思 呢 ? 跟 前 面 所 说 的 调用 类 方法 有 什么 关 
系 吗 ? 先 看 代码 : 


#!/usr/bin/env python 


# coding=utf-8 
_ metaclass = type 


class StaticMethod: 
@staticmethod 
def foo(): 


print "This is static method foo()." 


class ClassMethod: 
@classmethod 
def bar(cls) : 


print "This is class method bar()." 


print "bar() is part of class:", cls. name _ 
if name. == "main__": 
static_ foo = StaticMethod() # 实 例 化 
static_foo.foo() # 实 例 调用 静态 方法 
StaticMethod.foo() # 通 过 类 来 调用 静态 方法 
print ws 
class_bar = ClassMethod() 
class_bar .bar() 
ClassMethod.bar() 


对 于 这 部 分 代码 ， 有 一 处 非常 特别 ， 那 就 是 包含 了 “@” 符 号 ( 带 @ 符 
号 的 东西 是 很 神奇 的 ) 。 在 Python 中 : 


(1) @staticmethod 表 示 下 面 的 方法 是 静态 方法 。 
(2) @classmethod 表 示 下 面 的 方法 是 类 方法 。 


是 不 是 感到 有 点 莫名 其 妙 ? 少 安 毋 躁 ， 一 个 一 个 解释 。 


先 看 静态 方法 ， 昌 然 名 为 静态 方法 ， 但 也 是 方法 ， 所 以 ， 依 然 用 def 语 
句 来 定义 。 需 要 注意 的 是 文件 名 后 面 的 括号 内 没有 self， 这 和 前 面 定 义 
的 类 中 的 方法 不 同 ， 也 正 是 因为 这 个 不 同 ， 才 给 它 外 取 了 一 个 名 字 
叫 作 静态 方法 ， 否 则 不 束 “ 汇 然 众 人 人 矣 *”。 如 来 没有 self， 那 么 也 就 无 法 
村 问 实 例 变 量 、 类 和 实例 的 属性 了 ， 因 为 它们 都 是 借助 self 来 传递 数据 


再 看 类 方法 ， 同 样 也 具有 一 般 方法 的 特点 ， 区 别 也 在 参数 上 。 类 方法 
的 参数 也 没有 self， 但 是 必须 有 cls 这 个 参数 。 在 类 方法 中 ， 能 够 访问 
类 属性 ， 但 是 不 能 访问 实例 属性 (读者 可 以 自行 设计 代码 检验 之 ) 。 


明确 两 种 方法 之 后 ， 继 续 探究 如 何 调用 。 两 种 方法 都 可 以 通过 实例 调 
用 ， 即 绑 定 实例 。 也 可 以 通过 类 来 调用 ， 即 StaticMethod.foo0 这 样 的 
这 也 是 区 别 一 般 方 法 的 地 方 ， 一 般 方 法 必须 通过 绑 定 实例 调 


上 述 代 码 运行 结果 : 


$ python 21001.py 


This is static method foo( ) . 


炎炎 炎炎 实 炎 类 


这 是 天 于 静态 方法 和 类 方法 的 简要 介绍 。 


正当 我 思考 如 何 讲解 地 更 深入 一 点 的 时 候 ， 想 起 了 以 往 看 过 的 一 篇 文 
草 ， 觉 得 人 家 讲 得 非常 到 位 。 文 章 标题 是 ， 《python 中 的 staticmethod 
和 classmethod 的 差异 》， 原 载 于 : www.pythoncentral.io/difference- 
between-staticmethod-and-classmethod-in-python/。 此 地 址 需要 你 准备 梯 
子 才 能 浏览 。 后 经 国人 翻译 ， 地 址 是 : 
http:/www.wklken.me/posts/2013/12/22/difference-between-staticmethod- 
and-classmethod-in-python.html ° 


4.6 ”多 态 和 封装 


“继承 "是 类 的 一 个 重要 特征 ， 在 编程 中 用 途 很 多 ， 虽 然 在 茶 些 具 体 、 
细节 的 层面 还 有 一 些 不 同 的 看 法 ， 但 是 ， 这 里 要 说 的 “多 态 * 和 “ 寺 

装 "无 论 是 在 理解 上 还 是 在 实 跋 上 都 是 有 争议 的 话题 。 所 谓 争 议 ， 多 来 
自 于 对 同一 个 现象 不 同 角度 的 理解 ， 特 别 是 有 不 少 经 验 丰富 的 程序 
员 ， 还 从 其 他 语言 的 角度 来 诠释 Python 的 多 态 等 。 不 管 有 多 少 不 同 的 
于 角 方式 我 们 部 要 对 这 两 个 东西 有 所 了解， 因为 它们 是 你 编程 水 平 
进 阶 的 必需 。 


4.6.1 多 态 


到 网 上 搜索 "多 态 ”， 仁 者 见 仁 智 者 见 智 。Python 中 关于 多 态 的 基本 体 
现 ， 可 以 通过 下 面 的 方式 来 理解 。 


>>> "This is a book".count("s") 


这 
>>> [1,2,4,3,5,3].count(3) 


4 


countO 函 数 的 作用 十 数 一 数 某 个 元 素 在 对 象 中 出 现 的 次 数 。 从 例子 中 
可 以 看 出 ， 我 们 并 没有 限定 count 的 参数 所 引入 的 值 应 该 是 什么 类 型 
的 。 类 似 的 例子 还 有 : 


>>> f = lambda x, y: x+y 


还 记得 这 个 lambda 函 数 吗 ? 


we (2 

5 

人 

'qiwsir' 

>>> f(["python", "java"], ["ct+", "lisp"]) 


[ “python java's ett"y Tisp"] 


在 这 个 lambda 函 数 中 ， 我 们 没有 限制 应 该 传 入 什么 类 型 的 对 象 (或 者 
说 数据 、 值 ) ， 也 一 定 不 能 限制 ， 因 为 如 果 限 制 了 ， 就 不 是 pythonic 

了 。 也 就 是 说 ， 人 允许 给 参数 传 任意 类 型 的 数据 ， 并 返回 相应 的 结果 ， 

至 于 是 否 报 错 ， 则 取决 于 “+” 的 能 力 范 围 。 这 束 是 “多 态 ” 的 表现 。 


“多 态 " 和 是 否 能 正确 表达 ， 不 是 通过 限制 传 入 的 对 象 类 型 实现 ， 而 是 这 
样 处 理 : 
> 2 
Traceback (most ent call last): 
File "<stdi line 1, dule 
Fil td line 1, lambda> 
TypeE t catenat | d 'int' objects 


这 个 例子 中 ， 把 判断 两 个 对 象 是 否 能 够 相 加 的 任务 交 给 了 “+”， 不 是 放 
在 入 口 处 判断 类 型 是 否 为 字符 串 或 者 数字 。 

申明 ， 本 书 由 于 无 意 对 概念 进行 讨论 ， 所 以 不 进行 这 方面 的 深入 探 
索 ， 仅 仅 是 告诉 各 位 读者 相关 人 信息。 并且， 既然 大 多 数 程序 员 都 在 讨 
论 多 态 ， 那 么 我 们 束 按 照 大 多 数 人 说 的 去 介绍 。 

“多 态 ”(\Polymorphism) ， 维 基 百 科 中 对 此 有 详细 解释 说 明 。 


多 型 (英语 : Polymorphism) ， 是 指 面向 对 和 象 程序 执行 时 ， 相 同 的 信 
a eR i 
尽 


对 应 类 别 的 方法 而 有 不 同 的 行为 。 简 单 来 说 ， 所 谓 多 型 意 指 相同 的 信 
轧 给 予 不 同 的 对 象 会 引发 不 同 的 动作 。 


简化 的 说 法 就 是 “有 多 种 形式 *"， 就 算 不 知道 变量 (参数 ) 所 引用 的 对 
象 类 型 ， 也 一 样 能 进行 操作 ， 来 者 不 拒 ， 比 如 上 面 显示 的 例子 。 在 
Python 中 ， 更 为 pythonic 的 做 法 是 根本 就 不 进行 类 型 检验 。 


例如 著名 的 repr0 函 数 ， 它 能 够 针对 输入 的 任何 对 象 返回 一 个 字符 串 ， 
这 就 是 多 人 态 的 代表 之 一 。 


>>> repr([1, 2, 3]) 


的 

>>> repr(1) 

11， 

>>> repr({"lang": "python"}) 


"{'lang': 'python'}" 


使 用 它 写 一 个 小 函数 ， 还 是 作为 多 态 举 例 。 


>>> def length(x): 


print "The length of", repr(x), "is", len(x) 


>>> length("how are you") 

The length of 'how are you' is 11 
>>> length([1, 2, 3]) 

The length of [1, 2, 3] is 3 


>>> length({"lang":"python", "book":"itdiffer.com"}) 


The length of {'lang': 'python', 'book': 'itdiffer.com'} is 2 


不 过 ， 多 态 也 不 是 万 能 的 ， 如 果 这 样 做 : 


>>> length(7) 

The length of 7 is 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 2, in length 


TypeError: object of type 'int' has no len() 


报错 了 。 看 错误 提示 ， 明 确 告 诉 了 我 们 “object of type'int'has no len()”， 
也 残 是 说 ， 函 数 lengthO 中 的 len0 会 对 传 入 的 对 象 进行 检验 ， 如 有 果 不 符 
0 i i 
馨 整 。 


在 诸多 介绍 多 态 的 文章 中 都 会 有 关于 “ 猫 和 狗 ” 的 例子 。 这 里 也 将 代码 
贴 出 来 ， 读 者 去 体会 所 谓 多 人 态 体 现 。 其 实 ， 如 果 你 进入 了 Python 的 语 
境 ， 有 了 时 不 经 意 间 就 在 应 用 多 人 态 特 性 。 


#!/usr/bin/env python 


# coding=utf-8 


the code is from: http://zetcode.com/lang/python/oop/ 


_ metaclass = type 


class Animal: 
def _ init (self, name = ""): 
self.name = name 
def talk(self): 


pass 


class Cat(Animal): 
def talk(self): 


print "Meow!™" 


class Dog(Animal): 


def talk(self): 


print "Woof!™" 


a = Animal() 


a.talk() 


c= Cat("Missy") 


c.talk() 


d = Dog("Rocky") 


d.talk() 


保存 后 运行 之 : 


$ python 21101.py 
Meow! 


Woof ! 


代码 中 有 Cat 和 Dog 两 个 类 ， 都 继承 了 类 Animal， 它 们 都 有 talk(0) 方 法 ， 
输入 不 同 的 动物 名 称 ， 会 得 出 相应 的 结果 。 


关于 多 态 ， 有 一 个 被 称 作 “鸭子 类 型 ”(duck typeing) 的 东西 ， 其 含义 
在 维基 百科 中 被 表述 为 : 


在 程序 设计 中 ， 了 鸭子 类 型 (英语 : duck typing) 是 动态 类 型 的 一 种 风 
格 。 在 这 种 风格 中 ， 一 个 对 象 有 将 的 语义 ， 不 是 由 继承 目 特 定 的 类 或 
实现 特定 的 接口 ， 而 是 由 当前 方法 和 属性 的 集合 决定 。 这 个 概念 的 名 
字 来 源 于 James Whitcomb Riley 提 出 的 鸭子 测试 , “鸭子 测试 ?可 以 这 样 
表述 : “ 当 看 到 一 只 鸟 走 起 来 像 蝎 子 、 游 泳 起 来 像 蝎 子 、 叫 起 来 也 像 鸭 
子 ， 那 么 这 只 乌 歼 可 以 被 称 为 鸭子 。” 


最 后 要 提示 读者 ， 类 型 检查 是 毁 掉 多 态 的 利 右 ， 比 如 type、isinstance 
以 及 isubclass 函 数 ， 所 以 ， 一 定 要 慎 用 这 些 类 型 检查 函数 。 

4.6.2 ” 封 友 和 私有 化 

在 正式 介绍 封装 之 前 ， 先 讲 个 笑话 。 


某 软 件 公 司 老 板 号 称 目 己 懂 技 术 。 一 次 有 一 个 项 目 要 交付 给 客户 ， 他 
不 想 让 客户 知道 实现 某 些 功能 的 代码 ， 但 是 交付 的 时 候 必 须要 给 人 家 
代码 。 于 是 该 老板 吏 告 诉 程序 员 , “你 们 把 那 部 分 核心 代码 封闭 一 

下 ”。 程 序 员 听 完 迷 东 了 。 


很 多 人 没有 笑 ， 因 为 不 明白 说 的 是 什么 ， 不 知道 你 有 没有 笑 。 这 种 幽 
默 唯 一 的 价值 在 于 提 到 了 一 个 词语 封装" 。 


“封装 ?是 不 是 把 代码 写 到 某 个 东西 里 面 , “人 "在 编辑 大 中 打开 也 看 不 
到 呢 ? 不 是 ， 除 非 你 的 显示 融 坏 了 。 


在 程序 设计 中 ， 封 装 (Encapsulation) 是 对 对 象 (object) 的 一 种 抽 
象 ， 即 将 某 些 部 分 隐藏 起 来 ， 在 程序 外 部 看 不 到 ， 无 法 调用 (不 是 人 
用 眼睛 看 不 到 那个 代码 ， 除 非 用 某 种 加 密 或 者 混 消 方法 ， 造 成 显示 的 
是 一 堆 混 乱 的 代码 ， 但 这 不 是 封装 ) 。 


要 了 解 封 痛 离 不 开 <“ 私 有 化 ”， 融 是 将 类 或 者 函数 中 的 某 些 属性 限制 在 
某 个 区 域 之 内 ， 外 部 无 法 调用 ， 所 以 先 说 “私有 化 ”。 


“私有 化 ”， 顾 名 思 义 ， 就 是 将 某 个 对 象 (这 个 对 象 可 以 是 你 认为 的 东 
西 ) 限制 在 某 个 自己 认定 的 范围 内 。 比 如 ， 某 国 经 济 实行 私有 化 ， 就 
古 将 经 济 体 系 中 组 成 部 分 分 别 纳入 到 个 人 权限 范畴 ， 而 不 是 放 在 众多 
个 人 无 法 触及 的 领域 ( 那 是 公有 ) ， 或 者 说 ， 私 有 化 就 是 产权 清晰 。 
与 之 对 应 的 是 “公有 ”。 


Python 中 私有 化 的 方法 也 比较 简单 ， 就 是 在 准备 私有 化 的 属性 (包括 
方法 、 数 据 ) 名 字 前 面 加 双 下 画 线 。 例 如 : 


#!/usr/bin/env python 


# coding=utf-8 


def _python(self) : 


print "I love Python ." 


def code(self) : 
print "Which language do you like?" 


Self. python() 


print p.__name 


运行 一 下 ， 看 看 效果 : 


$ python 21102 .py 
qiwsir 
Traceback (most recent call last): 
File "21102.py", line 21, in <module> 
print p.__name 


AttributeError: "ProtectMe' object has no attribute '__name' 


查看 报错 信息 ， 告 诉 我 们 没有 `、_name` 那 个 属性 。 果 然 隐藏 了 ， 在 类 
的 外 面 无 法 调用 。 再 试 试 类 里 面 的 那个 code0 有 是 否 可 以 使 用 ? 把 该 程 
序 做 适当 修改 。 


4 name. 


p = ProtectMe() 
p.code() 


p:—python() 


修改 好 之 后 保存 。 其 中 p.code0 的 意图 是 要 打印 出 两 句 话 : “Which 
language do you like?” 和 “I love Python.”，code() 方 法 和 私有 化 的 

_ python() 方 法 在 同一 个 类 中 ， 按 照 私 有 化 的 含义 ， 在 类 里 面 应 该 是 可 
人 "而 p._python0 试 图 通过 实例 在 类 的 外 面 调用 它 。 看 看 效 


$ python 21102.py 
Which language do you like? 
I love Python , 
Traceback (most recent call last): 
File "21102.py", line 23, in <module> 


p:—python() 


如 愿 以 偿 ， 该 调用 的 调用 了 ， 该 隐藏 的 隐藏 了 。 
用 上 面 的 方法 的 确 做 到 了 封装 。 但 是 ， 如 果 要 调用 那些 私有 属性 怎么 


办 ? 


可 以 使 用 property 函 数 。 请 看 下 面 的 例子 : 


#!/usr/bin/env python 


# coding=utf-8 


$ python 21102.py 


kivi 


从 上 面 可 以 看 出 ， 用 了 @property 之 后 ， 再 调用 那个 方法 的 时 候 ， 用 
p.name 的 形式 ， 束 好 像 在 调用 以 往 非 私 有 化 属性 一 样 。 


看 来 ， 封 装 的 确 不 是 “让 人 看 不 见 ”。 


4.7 ”特殊 属性 和 方法 


在 任何 类 中 ， 都 有 一 些 特殊 的 属性 和 方法 ， 它 们 的 特殊 性 从 表 观 束 能 
看 出 来 ， 通 常 是 用 双 画 线 ″ ”开头 和 结尾 。 本 书 中 把 它们 归 类 为 特殊 
的 属性 和 方法 ， 之 所 以 特殊 ， 是 因为 它们 跟 你 目 己 写 的 或 者 其 他 不 是 
以 ” ”开头 和 结尾 的 属性 、 方 法 有 所 差异 。 或 许 你 从 事 一 般 开 发 的 项 
目 时 ， 对 这 些 属 性 和 方法 使 用 得 不 多 ， 但 是 我 认为 也 是 有 必要 了 解 
的 ， 因 为 这 是 你 “From Beginner to Master” 过 程 中 必须 要 迈 出 的 一 步 。 
知道 有 这 一 步 ， 或 许 会 对 你 的 项 目 有 帮助 。 伦 话说 “ 乙 不 压 身 ”， 还 是 
认真 了 解 为 好 。 


4.7.1 _ dict __ 


要 访问 类 或 者 实例 的 属性 必须 通过 “object.attribute” 的 方式 ， 这 是 我 们 
已 经 熟知 的 了 。 在 这 个 认 知 的 基础 上 ， 请 思考 :类 或 者 实例 属性 在 


Python 中 是 怎么 存储 的 ? 如 何 修改 、 增 加 、 删除 属性 ， 以 及 我 们 能 不 
能 控制 这 些 属性 ? 下 面 就 一 一 道 来 。 


>>> class A(object ) : 


pass 


>>> a = A() 
>>> dir(a) 


[laos 1 dlattr + A 
ro 


d 人 
人 ， 有 i Mi Str shelasshook 一 
{Weakref 
WV 全 
>>> dir(A) 
[eass "yr delattre ,dict _'; ', '_format__', '_ getattribute ', '_ hash_', '_init ， "modul 
e_', '_ new ', '_reduce ', '_reduce ex ', '_repr_', '_ setattr_', '_ sizeof_ ', '_ str_', '__subclasshook _ 
'_ weakref_ _'] 
和 


用 dir0 能 够 查看 类 的 属性 和 方法 ， 从 上 面 的 结 采 中 可 以 看 出 ， 数 量 不 
少 ， 因 为 我 们 写 的 那个 类 里 面 只 有 pass， 所 以 在 列 出 的 结 末 中， 部 古 
以 ” ”开头 和 结尾 的 ， 这 些 都 是 所 谓 的 特殊 属性 和 方法 。 


i 


>>> class Spring(object): 


season = "the spring of class" 


>>> Spring._ dict _ 


dict_proxy({'_ dict ': <attribute '_ dict ' of 'Spring' objects> 

'season': 'the Spring of class', 

'_ module ': '_ main 

'_ weakref_ _': <attribute ' weakref_ ' of 'Spring' objects>, 
'_doc ': None}) 


为 了 便于 观察 ， 将 上 面 的 显示 结 采 进 行 了 换行 ， 每 个 键 / 值 对 一 行 。 


从 现实 的 结果 中 可 以 发 现 ， 有 一 个 键 “season”， 它 是 这 个 类 的 属性 : 
其 值 环 古 类 属性 的 数据 。 


>>> Spring._dict ['season'] 
"the Spring of class' 
>>> Spring.season 


"the Spring of class' 


Spring.，_dict 意思 是 访问 类 属性 ， 这 是 看 到 上 述 结果 为 字典 
类 型 而 想到 的 ; 到 基于 个 我 们 部 悉 的 方式 就 是 过 点 号 
实现 同样 的 效 末 。 


下 面 将 这 个 类 实例 化 ， 再 看 看 它 的 实例 属性 : 


>>> s = Spring() 


Do 8 dict, 
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实例 属性 的 _dict_ 古 空 的 。 有 反 奇 怪 ? 不 奇怪 ， 接 着 看 : 


>>> S.Season 


"the Spring of class' 


s.Season 以 该 是 指 癌 了 类 属性 中 的 Spring.season， 至 此 ， 我 们 其 实 还 没 
有 建立 任何 实例 属性 。 下 面 就 建立 一 个 实例 属性 : 


>>> s.season = "the spring of instance" 
Slick 


{'season': 'the spring of instance'} 


这 样 ， 实 例 属性 里 面 就 不 空 了 。 这 时 候 建 立 的 实例 属性 和 上 面 的 那个 
s.season 重 名 ， 并 日 把 原来 的 “遮盖” 了。 这 人 句 好 是 不 是 熟悉 ? 因为 在 讲 
A 届 性 * 和 “类 属性 * 的 时 候 就 提 到 了 ， 现 在 读者 肯定 理解 更 深入 


>>> s._dict_['season'] 


"the Spring of instance' 
>>> s.season 


"the Spring of instance' 


此 时 ， 那 个 类 属性 如 何 ? 我 们 看 看 : 


>>> Spring._dict ['season'] 
"the Spring of class' 
> Spring._ dict_ _ 


ot _proxy({'_ dict ': <attribute '_ dict ' of 'Spring' objects>, 'season': 'the spring of class', '_ module _': 
'_ weakref ': <attribute '_ weakref ' of 'Spring' objects>, '_ doc ': None 


> Spring.season 


"the Spring of class' 


Spring 的 类 属性 没有 受到 实例 属性 的 影响 。 


按照 前 面 讲 述 的 类 属性 和 实例 属性 的 操作 ， 如 果 将 实例 属性 
(s.season) 删除 ， 会 不 会 回 到 实例 属性 s._ dict_ 为 空 呢 ? 


>>> del s.season 
>52 8S. dict 
>>> s.season 


"the Spring of class' 


果然 打 回 原型 。 


你 可 以 定义 其 他 名 称 的 实例 属性 ， 它 一 样 被 存储 到 _dict 


>>> s.lang = "python" 
30% 3 dicot 
{'lang': 'python'} 
和 人 nc 


"python ' 


诚然 ， 这 样 做 仅仅 是 更 改 了 实例 的 _dict 内容 ， 对 Spring dict 无 
任何 影响 ， 也 了 束 是 说 通过 Spring.lang 或 者 Spring._dict_[lang'] 是 得 不 
到 上 述 结果 的 。 


>>> Spring.lang 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: type object 'Spring' has no attribute 'lang' 
>>3 Spring ‘dict = ["lang’] 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


KeyError: 'lang' 


那么 ， 如 果 这 样 操作 ， 会 怎样 呢 ? 


>>> Spring.flower = "peach" 


>>> Spring._ dict_ _ 


dict_proxy({'_ module ': '_ main 

"flower ': 'peach', 

"Season': 'the Spring of class', 

和 '_dict ' of 'Spring' objects>, '_ weakref ': <attribute '_ weakref ' of 'Spring' objects>, 
'_doc _': None 


>>> Spring._dict _['flower'] 


"peach ' 


类 的 _ dict_ 被 更 改 了 ， 类 属性 中 增加 了 一 个 fower 必 性。 但是， 实例 
的 _dict_ 中 如 何 ? 


人 


{'lang': 'python'} 


没有 被 修改 。 然 而 ， 还 能 这 样 : 


>>> s.flower 


"peach ' 


这 个 读者 是 否 能 解释 ? 其 实 又 回 到 了 前 面 第 一 个 出 现 s.season 上 面 了 。 
通过 上 面 的 探讨 ， 和 是 不 是 基本 理解 了 实例 和 类 的 _dict ， 并 且 也 看 到 
了 属性 的 变化 特点 。 特 别 是 ， 这 些 属性 都 十 可 以 动态 变化 的 ， 即 你 可 
以 随时 修改 和 增删 。 


属性 如 此 ， 方 法 呢 ? 下 面 就 看 看 方法 《类 中 的 函数 ) 。 


>>> class Spring(object): 


def tree(self, x): 


>>> Spring._dict _ 


dict_proxy({'_ dict ': <attribute '_ dict ' of 'Spring' objects>, 
'_ weakref__': <attribute ' weakref_ ' of 'Spring' objects>, 
'_ module _': '_ main __', 


"tree': <function tree at 0xb748fdf4>， 


'_doc ': None}) 


>>> Spring._dict ['tree'] 


<function tree at 9xb748fdf4> 


结果 跟前 面 讨论 属性 差不多 ， 方 法 tree() 也 在 dict 里 面 。 


>>> t = Spring() 
>3% 让 dict 


0 


又 跟前 面 一 样 。 虽 然 建立 了 实例 ， 但 是 在 实例 的 _dict_ 中 没有 方法 。 
接 下 来 执行 


>>> t.tree("xiangzhangshu") 


"xiangzhangshu ' 


还 记得 前 面 某 章 某 节 有 一 幅 盖 述 < 数据 流转 ”的 图 吗 ， 其 中 显示 非常 明 
确 ， 当 用 上 面 的 方式 执行 方法 的 时 候 ， 实 例 t 与 self 建 立 了 对 应 关系 ， 
两 者 是 一 个 外 一 个 内 。 在 方法 中 selfx=x， 将 x 的 值 给 了 selfx， 也 就 是 
实例 应 该 拥有 这 么 一 个 属性 。 


Bl Ys 


{'x': 'xiangzhangshu'} 


果然 如 此 。 这 也 印证 了 实例 t 和 self 的 关系 ， 即 实例 方法 (t.tree 
('xiangzhangshu') ) 的 第 一 个 参数 (self， 但 没有 写 出 来 ) 绑 定 实例 
t， 透 过 self.x 来 设 定 值 ， 给 t(， dict_ 添加 属性 值 。 


换 一 个 角度 再 看 看 : 


>>> class Spring(object ) : 
def tree(self, x): 


return x 


这 个 方法 中 没有 将 x 赋值 给 self 的 属性 ， 而 是 直接 retum， 结 果 古 : 


>> s = Spring() 


>>> s.tree("liushu") 


征 不 是 理解 更 深入 了 ? 


现在 需要 对 Python 中 的 一 个 观点 :“ 一 切 缘 对 象 " 再 深入 领情 。 以 上 不 
的 属性 和 方法 ， 都 符合 object.attribute 格 式 ， 并 且 属 性 


当 你 看 到 这 里 的 时 候 ， 要 么 明日 了 类 和 实例 的 _dict_ 的 特点 ， 要 么 吏 
Re 再 将 上 面 的 重复 一 授 ， 特 别 要 目 己 融 一 般 有 


需要 说 明 ， 我 们 对 _dict 的 探讨 还 留 有 一 个 尾巴 一 一 属性 搜索 路 人 径 。 
这 个 留 在 后 面 讲述 


不 管 是 类 还 是 实例 ， 其 属性 都 能 随意 增加 ， 有 时 这 不 是 一 件 好 事情 ， 
或 许 在 菜 些 时 候 你 不 希望 别人 增加 属性 。 有 办 法 四 ? 当然 有 ， 请 继续 
学 习 。 


4.7.2 _ slots 


_ slots_ 能 够 限制 属性 的 定义 ， 但 是 这 不 是 它 存在 的 终极 目标 ， 它 存 
在 的 终 裤 目标 应 该 是 在 编程 中 非常 重要 的 一 不 方面 优化 内 存 使 用 。 
在 某 些 编程 中 ， 优 化 内 存 是 非常 重要 的 ， 万 万 不 可 忽视 。 


>> class Spring(object ) : 
_ Slots__ = ("tree", "flower") 


>>> dir(Spring) 


['_class_', '_ delattr_ '，' doc ', '_ format ', '_ getattribute ', '_ hash_', '_init _', '_ module _  '，' new 
t reduce_ ', '_reduce ex ', '_ repr__', '_ setattr ', '_ sizeof_ ', '_ slots ', '_ str_', '__subclasshook _ 
1 


仔细 看 看 dir0 的 结果 ， 还 有 __dict_ 属 性 吗 ? 没有 了 。 也 就 是 说 
_slots_ 把 _dict_ 挤 出 去 了 ， 返 回来 看 看 ， 没 有 _ slots _， 现 在 它 进 
入 了 类 的 属性 。 


>>> Spring. slots, 


('tree', 'flower') 


a 类 Spring 有 且 仅 有 两 个 属性 ， 并 且 返 回 的 是 一 个 元 
有 x 


>>> t.__slots 


('tree', 'flower') 


实例 化 之 后 ， 实 例 的 _slots_ 与 类 的 完全 -一样 ， 这 跟前 面 的 _dict_ 大 
不 一 样 了 。 


>>> Spring.tree = "liushu" 


通过 类 ， 先 赋予 一 个 属性 值 。 然 后 检验 一 下 实例 能 否 修 改 这 个 属性 : 


>>> t.tree = "guangyulan" 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


AttributeError: 'Spring' object attribute 'tree' is read-only 


看 来 ， 我 们 的 意图 不 能 达成 ， 报 错 信 息 中 显示 tree 这 个 属性 是 只 读 的 ， 
不 能 修改 。 


2 ree 


'liushu' 


四 面 已 经 通过 类 给 这 个 属性 赋值 了 ， 不 能 用 实例 属性 来 修改 。 只 


>>> Spring.tree = "guangyulan" 
or ttre 


'guangyulan' 


用 类 属性 修改 。 但 是 对 于 没有 用 类 属性 赋值 的 ， 可 以 通过 实例 属性 : 


>>> t.flower = "haitanghua" 
>>> t.flower 


"haitanghua' 


此 时 : 


>>> Spring.flower 


<member 'flower' of 'Spring' objects> 


实例 属性 的 值 并 没有 传 回 到 类 属性 ， 你 也 可 以 理解 为 新 建 六 了 一 个 同 
名 的 实例 属性 。 如 采 再 给 类 属性 赋值 ， 那 么 束 会 这 样 了 : 


>>> Spring.flower = "ziteng" 
>>> t.flower 


"Ziteng 


当然 ， 此 时 再 给 t.flower 重 新 赋值 ， 就 会 报 出 跟前 面 一 样 的 错误 。 


>>> t.water = "green" 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


AttributeError: 'Spring' object has no attribute 'water' 


这 里 试图 给 实例 新 增 一 个 属性 ， 也 失败 了 。 


看 来 _slots_ 已 经 把 实例 属性 牢 牢 地 管控 了 起 来 ,但 更 本 质 的 是 优化 
了 内 存 。 诚 然 ， 这 种 优化 会 在 有 大 量 的 实例 时 显 出 效果 。 


4.7.3 getattr 、__setattr 和 其 他 类 似 方法 


结合 4.7.2 廊 内 容 ， 看 一 个 例子 : 


>>> class A(object): 


pass 


>a=A() 


Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


AttributeError: 'A' object has no attribute 'x' 


x 不 是 实例 的 成 员 4" 成员 ”党 统 指 类 的 属性 和 方法 ) ， 用 ax 访问 一 定 
会 报错 ， 这 是 大 家 所 共 知 的 ， 错 误 提 示 中 报告 了 原因 : “A'object has 
no attribute'x”™” 


也 就 是 说 ， 如 采访 问 a.x， 它 不 存在 ， 那 么 就 要 转向 到 某 个 操作 。 我 们 
1 ° 在 Python 中 ， 方 法 束 具 有 这 种 “ 迫 截 ”能 


。 setattr ” (selff，name，value) : 如 果 要 给 name 赋 值 ， 就 调用 这 
0 

。 getattr ” (self，name) : 如 果 name 被 访问 ， 同 时 它 不 存在 ， 此 
方法 被 调用 。 

。 getattribute (self，name) : 当 name 被 访问 时 自动 被 调用 ( 注 
意 : 这 个 仅 能 用 于 新 式 类 ) ， 无 论 name 是 否 存 在 ， 都 要 被 调用 。 

。 delattr ” (selff，name) : 如 果 要 删除 name， 这 个 方法 就 被 调 


[© 


下 面 用 例子 说 明 。 


>>> class A(object): 
def _ getattr_ (self, name): 
print "You use getattr" 


def _ setattr__(self, name, value): 


print "You use setattr" 


self._dict [name] = value 


类 A 是 新 式 类 ， 除 了 两 个 方法 ， 没 有 别 的 属性 。 


>>> a = A() 
>>> a.x 


You use getattr 


依然 调用 了 不 存在 的 属性 a.x， 按 照 开 头 的 例子 是 要 报错 的 。 但 是 ， 由 
于 在 这 里 使 用 了 getattr (self，name) 方法 ， 当 发 现 x 不 存在 于 对 
象 的 _dict_ 中 时 ， 就 调用 了 getattr “拦截 成 员 ”。 


>>> a.X = 7 


You use setattr 


给 对 象 的 属性 赋值 时 ， 调 用 了 setattr ” (self，name，value) 方法 ， 
这 个 方法 中 有 一 句 self， dict”[name]=value， 通 过 这 个 语句 ， 束 将 属 
性 和 数据 保存 到 了 对 象 的 _dict 中， 如 果 再 调用 这 个 属性 : 


和 


¥ 


x 已 经 存在 于 对 象 的 _dict 之 中 。 


在 上 面 的 类 中 ， 当 然 可 以 使 用 _getattribute (self，name) ， 因 为 它 
是 新 式 类 ， 并 且 ， 只 要 访问 属性 就 会 调用 它 。 例 如 : 


>>> class B(object ) : 


def _ getattribute (self, name): 
print "you are useing getattribute" 


return object. getattribute (self, name) 


为 了 与 前 面 的 类 区 分 ， 重 新 搞 一 个 类 ， 在 类 的 方法 _etattribute 0 中 使 


用 return object._ getattribute (self, name) 。 


再 来 访问 一 个 不 存在 的 属性 : 


>>> b = B() 


PP by 
you are useing getattribute 


Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 

File "<stdin>", line 4, in _ getattribute _ 
AttributeError: 'B' object has no attribute 'y' 
>>> b.two 
you are useing getattribute 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "<stdin>", line 4, in _ getattribute _ 


AttributeError: 'B' object has no attribute 'two' 


i 问 不 存在 的 成 员 ， 立 刻 被 _getattribute “拦截 了 ， 虽 然 最 后 还 是 要 


错 的 。 


>>> b.y = 8 
>>> b.y 
you are useing getattribute 


8 


当 给 其 赋值 后 ， 意 味 着 其 已 经 在 _dict 里面 了 ， 再 调用 ， 依 然 被 拦 
截 ， 但 是 由 于 其 已 经 在 _dict_ 内 ， 上 所 以 会 把 结果 返回 。 


特别 注意 ， 在 这 个 方法 中 ， 没 有 使 用 return Bel id ， 因 为 
如 果 用 这 样 的 方式 就 是 访问 self _dict_ ， 只 要 访问 类 的 某 个 属性 ， 就 
ns. 这 样 训 会 导致 无 限 递归 下 去 〈 死 循环 ) 。 要 


当 你 看 到 这 里 ， 有 是 不 是 觉得 上 面 的 方法 有 点 魔力 呢 ? 在 理解 前 述 内 容 
的 基础 上 ， 再 认真 阅读 下 面 的 代码 ， 会 体会 到 在 实践 中 的 应 用 。 


#!/usr/bin/env python 


# coding=utf-8 


Study getattr and Setattr 


class Rectangle(object): 


the width and length of Rectangle 


def _ init__(self): 
self.width = 0 
self.length = 0 

def setSize(self, size): 
self.width, self.length = size 


def getSize(self) : 


if 


上 面 的 代码 来 自 《Beginning Python:From Novice to Professional， 


Second Edittion》 (by Magnus Lie Hetland) ,根据 本 教程 的 需要 ， 稍 


return self.width, self.length 


name == "main__" 


r = Rectangle() 
r.width = 3 

r.length = 4 

print r.getSize() 
r,.SsetSize( (30，40) ) 
print r.width 


print r.length 


有 修改 。 


$ python 21301.py 


(3, 


30 


40 


这 段 代 码 已 经 可 以 正确 运行 了 ， 但 是 ， 作 为 一 个 精 共 求 精 的 程序 员 ， 
总 得 那 种 调用 方式 还 有 可 以 改进 的 空间 。 比 如 ， 要 给 长 宽 赋 值 的 时 
必须 赋予 一 个 元 组 ， 里 面包 含 长 和 宽 


六 
和 
总 沉 


候 ， 
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#!/usr/bin/env python 


# coding=utf-8 


class Rectangle(object): 


def _ init_ (self): 
self.width = 0 
self.length = 0 

def setSize(self, size): 
self.width, self.length = size 


def getSize(self) : 


return self.width, self.length 


size = property(getSize, setSize) 


name == "main__" 


r = Rectangle() 
r.width = 3 
r.length = 4 
print r.size 
r.size = 30，40 
print r.width 


print r.length 


。 这 个 能 不 能 改进 一 下 呢 ? 


以 上 代码 中 因为 加 了 一 句 size=property (getSize，setSize) ， 使 得 调用 
0 。 原 来 用 r.getSize()， 现 在 使 用 r.size， 束 好 像 调 用 一 个 属 


虽然 优化 了 上 面 的 代码 ， 但 是 还 没有 和 本 区 讲述 的 特殊 方法 拉 上 关 
系 ， 所 以 ， 还 要 继续 改写 。 


#!/usr/bin/env python 


# coding=utf-8 


class NewRectangle(object): 
def _ init__(self): 
self.width = 0 
self.length = 0 
def _ setattr_ (self, name, value): 
if name == "size": 
self.width, self.length = value 
else: 
self._dict [name] = value 
def _ getattr__(self, name): 
if name == "size": 
return self.width, self.length 
else: 


raise AttributeError 


if name == "main__" 


r = NewRectangle() 
r.width = 3 
r.length = 4 
print r.size 
r.size = 30, 40 
print r.width 


print r.length 


除了 类 的 样式 变化 之 外 ， 调 用 样式 没有 变 ， 结 果 是 一 样 的 。 
4.7.4 获得 属性 顺序 


通过 实例 获取 其 属性 ， 如 果 在 _ dict_ 中 有 ， 就 直接 返回 其 结果 ; 如 果 
没有 ， 会 到 类 属性 中 找 。 比 如 : 


#!/usr/bin/env python 


# coding=utf-8 


class A(object): 


author = "qiwsir" 
def _ getattr_ (self, name): 


if name != "author": 


a= A() 
print a.author 


print a.lang 


运行 程序 : 


$ python 21302.py 


当 a=AO 后 ， 并 没有 为 实例 建立 任何 属性 ， 或 者 说 实例 的 _dict_ 是 至 
的 〈 意 思 和 是 说 没有 某 些 属性 值 ) 。 但 是 如 果 要 查看 a.author， 因 为 实例 
的 属性 中 没有 ， 所 以 吏 去 类 属性 中 找 ， 发 现 宁 然 有 ， 于 起 返 回 其 值 
qiwsir。 但 是 ， 找 alang 时 候 ， 不 仅 实例 属性 中 没有 ， 类 属性 中 也 没 
有 ， 于 是 束 调 用 了 _ getattr_() 方 法 。 幸 好 在 这 个 类 中 有 这 个 方法 ， 如 
果 没 有 _ getattr_() 方 法 呢 ? 如 采 没 有 定义 这 个 方法 ， 吏 会 引发 


AttributeError ° 
这 就 是 通过 实例 查找 特性 的 顺序 。 
4.8 迭代 钻 


ee ， 已 经 多 次 看 到 这 个 词语 并 对 其 有 了 初步 
年 了 。 


我 们 已 经 知道 ， 对 序列 《列表 、 元 组 ) 、 字 典 和 文件 都 可 以 用 iter() 方 
法 生成 迭代 对 象 ， 然 后 用 next() 方 法 访问 。 当 然 ， 这 种 访问 不 是 目 动 
的 ， 如 果 用 for 循 环 ， 束 可 以 目 动 完成 上 述 访问 了 。 


如 果 用 dir (list) 、dir (tuple) 、dir (file) 、dir (dict) 来 查看 不 同类 
型 对 象 的 属性 ， 会 发 现 它们 都 有 一 个 名 为 _iter_ 的 东西 。 这 应 该 引起 
读者 的 关注 ， 因 为 它 和 迭代 器 (iterator) 、 内 置 的 函数 iter0 在 名 字 上 
很 像 ， 除 了 前 后 的 双 下 画 线 。 望 文生 义 ， 我 们 也 能 猜 出 它 肯 定 是 跟 迭 
代 有 天 的 东西 。 当 然 ， 这 种 猜测 也 不 是 没有 根据 的 ， 其 重要 根据 就 是 


.004 如 采 它 们 之 间 没 有 一 点 关系 ， 肯 定 不 会 将 命名 设置 的 一 


是 的 ，_iter _ 束 是 对 象 的 一 个 特殊 方法 ， 它 是 友 代 规则 (iterator 
potocol) 的 基础 。 或 者 说 ， 如 果 对 象 没 有 它 ， 就 不 能 返回 迭代 右 ， 就 
没有 next( 方 法 ， 束 不 能 迭代 。 

如 果 读 者 用 的 是 Python 3.x， 迭 代 器 对 象 实现 的 是 _next_() 方 法 ， 不 
是 next0)。 并 且 ， 在 Python 3.x 中 有 一 个 内 建 函 数 next0， 可 以 实现 next 
， ， 访 问 迭 代 右 ， 这 相当 于 Python 2.x 中 的 it.next() (it 是 迭代 对 


[© 


4.8.1 _ iter_/() 


类 型 是 ]ist、tuple、 人 le、dict 的 对 象 有 _ iter (0 方法， 标志 着 它们 能 够 
送 代 。 这 些 类 型 都 是 Python 中 国有 的 ， 我 们 能 不 能 自己 写 一 个 对 象 ， 
让 它 能 够 迭代 呢 ? 


#!/usr/bin/env python 


# coding=utf-8 


class MyRange(object ) : 
def _ init (self, n): 


self.i = 0 


def _ iter__(self): 
return self 
def next(self): 
if self.i < self.n: 
i = self.i 
self.i += 1 
return i 
else: 


raise StopIteration() 


A name. == " 


x = MyRange(7) 
print "x.next()==>", x.next() 
print "x.next()==>", x.next() 


print "------ for loop-------- 


print i 


将 代码 保存 并 运行 ， 结 采 是 : 


$ python 21401.py 
x.next()==> 0 


x.next()==> 1 


以 上 代码 的 含义 ， 古 目 己 仿 写 了 拥有 range() 的 对 象 ， 这 个 对 象 是 可 碗 
代 的 ， 分 析 如 下 。 


(1) _iter_0 是 类 中 的 核心 ， 它 返回 了 迭代 器 本 身 ， 实 现 了 _ iter_0 
方法 的 对 象 ， 即 意味 着 其 可 迭代 。 


(2) 含有 next0) 的 对 象 就 是 迭代 器 ， 并 且 在 这 个 方法 中 ， 在 没有 元 素 
的 时 候 要 发 起 StopIteration0 有 异常 。 


对 以 上 类 的 调用 换 一 种 方式 : 


if name == "main__" 


x = MyRange(7) 
print list(x) 


print "x.next()==>", x.next() 


运行 后 会 出 现 如 下 结 


$ python 21401.py 
[9, 1, 2, 3, 4, 5, 6] 
x.next()==> 
Traceback (most recent call last): 
File "21401.py", line 26, in <module> 
print "x.next()==>", x.next() 
File "21401.py", line 21, in next 
raise StopIteration() 


StopIteration 


说 明 什 么 呢 ? print list (x) 将 对 象 返 回 值 都 装 进 了 列表 中 并 打印 出 
来 ， 这 个 正常 运行 了 。 最 终 ， 指 针 移 动 到 了 和 迭代 对 象 的 最 后 一 个 ， 
next() 方 法 没有 检测 ， 也 不 知道 是 不 是 要 停止 了 ， 它 还 要 继续 下 去 ， 当 
继续 下 一 个 的 时 候 ， 才 发 现 没 有 元 素 了， 于 是 返回 了 StopIteration()。 


0 就 像 上 面 的 例子 一 样 ， 列 表 不 是 挺 
J 吧 ? 


列表 的 确 非 第 好 ， 在 很 多 时 候 效率 很 品 ， 并 且 能 够 解决 很 多 普 衣 的 问 
题 。 但 是 ， 不 要 环 记 ， 在 某 些 时 候 ， 列 表 可 能 会 给 你 市 来 灾难 。 因 为 
在 你 使 用 列表 的 时 候 ， 需 要 将 列表 内 容 一 次 性 都 读 入 到 内 存 中 ， 这 样 
吕 增 加 了 内 存 的 负担 。 如 采 列 表 太 大 ， 束 有 内 存 溢出 的 危险 了 ， 这 时 
候 束 需要 迭代 对 象 。 比 如 斐 波 那 兢 数 列 : 


#!/usr/bin/env python 


# coding=utf-8 


i fb 1f.b J 1f.b 
turn fib 
if _ name == 
fibs = Fibs(5) 


print list(fibs) 


运行 结 末 是 : 


$ python 21402.py 


[9，1，1，2，3，5] 


给 读者 一 个 思考 问题 : 要 在 斐 波 那 契 数 列 中 找 出 大 于 1000 的 最 小 的 
数 ， 能 不 能 在 上 述 代 码 的 基础 上 改造 得 出 呢 ? 


4.8.2 range() 和 xrange() 


天 于 列表 和 迭代 天 之 间 的 区 别 还 有 两 个 非常 典型 的 内 建 画 数 : range( 
和 xrange0， 研 究 一 下 这 两 个 内 建 画 数 的 差异 ， 会 有 所 收获 的 。 


range(...) 
range(stop) -> list of integers 
range(start, stop[, step]) -> list of integers 


>>> dir(range) 


[call "sy "_ Class _ " np yy " Melattr ; '_ doe i " 6 yy " a 2 ' 19e ', '__getattribute_ 
1 ri 1 1 i 1 7 1 ' 于 ' 
二 gt hash init le 1 module name f ew 
'_reduce ex ', '_repr__', '_ self_ ', '_ setattr ', '_ sizeof__', '_ str_', ' Bobetho | 


从 range0) 的 帮助 文档 和 方法 中 可 以 看 出 ， 它 的 结果 是 一 个 列表 。 但 
是 ， 如 果 用 help (xrange) 查看 


class xrange(object) 
xrange(stop) -> xrange object 


xrange(start, stop[, step]) -> xrange object 


Like range(), but instead of returning a list, returns an object that 


generates the numbers in the range on demand. For looping, this is 


slightly faster than range() and more memory efficient. 


xrange() 返 回 的 是 对 象 ， 类 似 range()， 但 不 是 列表 。 在 循环 的 时 候 ， 它 
跟 rangeO 相 比 “slightly faster than range()and more memory efficient”( 稍 
快 并 具有 更 高 的 内 存 效 率 ) 。 查 看 它 的 方法 : 


>>> dir(xrange) 


['_class_', '_delattr ', '_doc ', '_ format ', '_ getattribute ', '_ getitem ', '_ hash_', '_init _', '_it 
er__' '_reduce ', '_ reduce ex ', '_repr__', '_reversed ', '_ setattr_ ', '_ sizeof__' 


en ， new 
str_', '_ subclasshook _'] 


看 到 令 人 兴奋 的 _iter 了 吗 ? 说 明 它 是 可 迭代 的 ， 它 返回 的 是 一 个 可 
迭代 的 对 象 。 


也 束 是 说 ， 通 过 range() 得 到 的 列表 会 一 次 性 被 读 入 内 存 ， 而 xrange() 返 
Be 则 需要 一 个 数值 才 返回 一 个 数值 。 看 一 个 把 zip0 牵 扯 进 来 
内 o 


>>> zip(range(4), xrange(100000000)) 


[(9，9)，(1，1)，(2，2)，(3，3)] 


第 一 个 range (4) 产生 的 列表 被 读 入 内 存 ; 第 二 个 很 长 ， 但 是 不 用 担 
心 ， 它 根本 不 会 产生 那么 长 的 列表 ， 因 为 只 需要 前 4 个 数值 ， 它 就 提供 
前 4 个 数值 。 如 果 你 要 修改 为 range (100000000) ， 就 要 花费 时 间 了 ， 
但 可 以 尝试 一 下 。 


迭代 磺 的 确 有 迷人 之 处 ， 但 是 它 也 不 是 万 能 之 物 。 比 如 迭代 器 不 能 


退 ， 只 能 如 过 河 的 学 子 ， 不 断 癌 前 。 另 外 ， 和 迭代 融 也 不 适合 在 多 线程 
环境 中 对 可 变 集合 使 用 。 


4.9 生成 句 

生成 器 (generator) 是 一 个 非常 迷人 的 东西 ， 也 和 常 被 认为 是 Python 的 
高 级 编程 技能 。 我 很 乐意 在 这 里 跟 读 者 探讨 这 个 话题 ， 因 为 我 相信 读 
者 看 本 书 的 目的 绝 非 仅仅 将 自己 限制 于 初学 者 水 平 ， 一定 有 一 颗 不 蚜 
的 心 要 成 为 Python 高 手 。 于 是 乎 ， 需 要 了 解 生 成 塘 。 


“迭代 器 > 已 经 是 很 熟悉 了 吧 ? 生成 器 和 人 迭代 器 有 着 一 定 的 渊源 。 首 先 
生成 器 必须 是 可 和 迭代 的 ， 但 它 又 不 完全 等 同 于 迭代 器 。 


4.9.1 人 简单 的 生成 妖 


>>> my_generator = (x*x for x in range(4)) 


这 是 不 是 跟 列 表 解 析 很 类 似 呢 ? 仔细 观察 ， 它 不 是 列表 ， 像 下 面 这 样 
得 到 的 才 是 列表 : 


>>> my_list = [x*x for x in range(4)] 


以 上 两 者 的 区 别 在 于 前 者 古方 括号 “[]”* 后 者 十 圆 括号 “Q)”， 哩 然 是 细小 
的 差别 ， 但 是 结果 完全 不 一 样 。 


>>> dir(my_generator ) 


[Class 7 delattr PC OF * getattributes ; * hash . + nit 


为 了 容易 观察 ， 将 原来 得 到 的 结果 进行 了 重新 排版 。 是 不 是 发 现 了 在 
迭代 絮 中 必 有 的 方法 _ inter_ (和 next0? 这 说 明 my_generator 是 可 和 迭代 
的 ， 可 以 用 for 循 环 来 依次 读 出 其 值 。 


>>> for i in my_generator 


当 第 一 遍 循 环 的 时 候 ， 将 my_generator 里 面 的 值 依次 读 出 并 打印 ， 但 
和 定 ， 若 再 读 一 次 ， 就 发 现 没 有 任何 结果 (游标 已 经 移动 到 最 后 了 ) ， 
这 种 特性 也 正 是 太 代 絮 所 具有 的 。 


如 有 果 对 那个 列表 ， 就 不 一 样 了 : 


>>> for i in my_list: 


难道 生成 器 束 是 把 列表 解析 中 的 “[]” 换 成 “0” 这 么 简单 吗 ? 这 仅仅 是 生 
成 器 的 一 种 表现 形式 和 基本 使 用 方法 既 了 ， 仿 照 列表 解析 式 的 命名 ， 
可 以 称 之 为 "生成 器 解析 式 ”( 或 者 : 生成 器 推导 式 、 生 成 器 表达 


式 ) 


生成 侨 解 析 式 有 很 多 用 途 ， 在 不 少 地 方 可 以 车 代 列 表 解 析 ， 特 别 十 针 
对 大 数据 的 时 候 ，Python 处 理 列表 时 ， 将 全 部 数据 都 读 入 到 内 存 ， 而 


迭代 需 〈 生 成 器 是 欠 代 器 ) 的 优势 就 在 于 只 将 所 需要 的 读 入 内 存 里 ， 
因此 生成 侨 解 析 式 比 列 表 解 析 式 少 占 内 存 ， 再 看 实例 : 


>>> sum(i*i for i in range(10)) 


285 


这 个 例子 是 计算 1 到 10 以 内 的 目 然 数 的 平方 和 ， 请 观察 sum() 运 算 ， 这 
样 做 是 不 是 感觉 很 迷人 ? 如 果 是 列表 ， 你 不 得 不 : 


sum([i*i for i in range(10)]) 


285 


虽然 生成 器 解析 式 貌 似 不 错 ， 但 是 对 其 真正 的 含义 ， 还 需要 我 们 做 深 
入 探究 才能 揭晓 。 


4.9.2 ”定义 和 执行 过 程 


yield 这 个 词 在 汉语 中 有 “生产 、 出 产 ” 之 意 ， 在 Python 中 ， 它 作为 一 个 
关键 词 (变量 、 画 数 、 类 的 名 称 中 不 能 用 它 来 命名 ) ， 是 生成 器 的 标 


TE 
Zoo ef g(): 
yield 9 
yield 1 
yield 2 
9 


<function g at Oxb71f3b8c> 


建立 了 一 个 非常 傈 单 的 画 数 ， 跟 以 往 看 到 的 函数 唯一 不 同 的 地 方 是 用 
了 三 个 yield 语 句 。 然 后 进行 下 面 的 操作 : 


>>> ge = 9g() 

>>> ge 

<generator object g at QOxb7200edc> 
>>> type(ge) 


<type 'generator'> 


上 面 建立 的 函数 返回 值 是 一 个 生成 器 (generator) 类 型 的 对 象 。 


>>> dir(ge) 


， 1 村 这 1 1 ; 本 i 1 i ' 
/ / / / / 1 7 7 到 

L class delattr doc format getattribute hash init iter name, 

_', '_new ', '_reduce ', '_reduce ex ', '_repr__', '_ setattr_ _', '_ sizeof_', '_ str__', '__subclasshook __', 


'close', 'gi code', 'gi frame', 'gi_running', "next'， 'send', 'throw'] 


0 说 明 它 是 迷 代 器 。 有 既然 如 此 ， 当 然 可 
以 : 


从 例子 中 可 以 看 出 ， 含 有 yield 关 键 词 的 函数 是 一 个 生成 器 类 型 的 对 
象 ， 这 个 生成 器 对 象 是 可 迭代 的 。 


我 们 把 含有 yield 语 句 的 函数 称 作 生 成 侨 ， 生 成 妖 是 一 种 用 普通 函数 语 
法 定义 的 迭代 器 。 


通过 上 面 的 例子 可 以 看 出 ， 这 个 生成 絮 在 定义 过 程 中 并 没有 显 化 地 使 
用 _inter (和 next()， 而 是 只 要 用 了 yield 语 句 (yield 关 键 词 发 起 的 语 
» 0 也 就 具备 了 迭代 器 的 
功能 特性 。 


yield 语 句 的 作用 残 是 在 调用 的 时 候 返 回 相 应 的 值 。 下 面 详 细 剂 析 一 下 
上 面 的 运行 过 程 。 


除了 返回 生成 絮 之 外 ， 什 么 也 没有 操作 ， 任 何 值 也 没有 
外 返 回 。 

ge.next(): 直到 这 时 候 ， 生 成 絮 才 开始 执行 ， 过 到 了 第 一 个 yield 
语句 ， 将 值 返回 ， 并 暂停 执行 《有 的 称 之 为 挂 起 ) 。 

ge.next(): 从 上 次 暂停 的 位 置 开始 ， 继 续 癌 下 执行 ， 遇 到 yield 语 
句 ， 将 值 返回 ， 又 暂停 。 

gen.next(): 舍 义 与 ge.next(0 相 同 。 

gene.next(): 从 上 面 的 挂 起 位 置 开始 ， 但 是 后 面 没 有 可 执行 的 了 ， 
于 是 next() 发 出 异常 。 


从 上 面 的 执行 过 程 中 会 发 现 yield 除 了 作为 生成 恬 的 标志 之 外 ， 还 有 一 
个 功能 就 是 返回 值 。 那 么 它 跟 return 这 个 返回 值 有 什么 区 别 呢 ? 


4.9.3 yield 
为 了 弄 清 楚 yield 和 return 的 区 别 ， 我 们 写 两 个 没有 什么 用 途 的 函数 


>>> def r_return(n) : 
print "You taked me." 
while n > 09: 
print "before return" 
return n 
n -= 1 


print "after return" 


>>> rr = r_return(3) 
You taked me. 

before return 

we TT 


各 


从 函数 被 调用 的 过 程 可 以 清晰 看 出 ， 从 rr=r_ return (3) 开始 ， 束 执行 
函数 体内 容 了 ， 当 遇 到 retum 的 时 候 执行 该 语句， 将 值 返回 ， 然 后 吕 结 
束 函 数 体内 的 执行 ， 所 以 returm 后 面 的 语句 根本 没有 执行 。 


如 果 将 return 改 为 yield: 


>>> def y_yield(n): 
print "You taked me." 
while n > 9: 
print "before yield" 
yield n 
Nn = 三 和 


print "after yield" 


>>> yy = y_yield(3) # 没 有 执行 函数 体内 语句 


>>> yy.next() # 开 始 执行 
You taked me. 


before yield 


3 # 仙 到 yield， 返 回 值 ， 并 暂停 


>>> yy.next() # 从 上 次 暂停 位 置 开始 继续 执行 


after yield 
before yield 
2 # 又 过 到 yield， 返 回 值 ， 并 和 暂停 


>>> yy.next() 


after yield # 没 有 满足 条 件 的 值 ， 抛 出 异常 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


StopIteration 


结合 注释 和 前 面 对 执 行 过 程 的 分 析 ， 读 者 一 定 能 理解 yield 的 特点 了 ， 
也 深 知 与 return 的 区 别 了 。 


一 般 的 钞 数 ， 都 是 止 于 return。 作 为 生成 费 的 钞 数 ， 由 于 有 了 yield， 通 
到 它 则 程序 挂 起 ， 如 果 在 之 后 还 有 retum， 巡 到 它 就 直接 抛 出 
SoptIteration 异 常 而 中 止 迭代 。 


斐 波 那 契 数列 已 经 是 老 相 识 了 ， 不 论 是 循环 还 是 迭代 都 用 它 举例 过 ， 
现在 还 用 它 举 例 ， 只 不 过 要 用 上 yield 。 


#!/usr/bin/env python 


# coding=utf-8 


def fibs(max): 
人 
while n < max 
yield b 
i 


许 : 洁 :这 


if name == " 


f = fibs(10) 
for i in f: 


print-1 3 


运行 结 采 如 下 : 


$ python 21501.py 


和 和 汪 这 计量.34::55 


用 生成 右 方 式 实现 的 韭 波 那 契 数列 是 不 是 跟 以 前 的 有 所 不 同 了 呢 ? 读 
. oa ad 中 已 经 演示 过 的 斐 波 那 兆 数列 实现 做 对 比 ， 体 会 各 种 方 
四 


至 此 ， 已 经 明确 ， 一 个 函数 中 ， 只 要 包含 了 yield 语 句 ， 它 束 是 生成 
髓 ， 也 是 迭代 器。 这 种 方式 显然 比 前 面 写 送 代 右 的 类 要 们 便 多 了 ， 但 
这 并 不 意味 着迷 代 右 束 被 抛弃 ， 是 用 生成 器 还 是 用 从 代 器 要 根据 具体 
的 使 用 情景 而 定 。 


4.9.4 生成 器 方法 


在 Python2.5 以 后 ， 生 成 器 有 了 一 个 新 特征 ， 就 是 在 开始 运行 后 能 够 为 
生成 器 提供 新 的 值 。 这 就 好 似 生成 器 和 “外 办 ”之 间 进 行 数据 交流 。 


while True: 


n= (yield n) 


>> r = repeater(4) 


>>> r.next() 


>>> r.send("hello") 


'hello' 


当 执 行 到 rnextO 的 时 候 ， 生 成 器 开始 执行 ， 在 内 部 过 到 了 yield n 挂 

起 。 注 意 在 生成 器 函数 中 ，n= (yield n) 中 的 yield n 是 一 个 表达 式 ， 
并 将 结果 赋值 给 np， 虽 然 不 严格 要 求 它 必须 用 圆 括 号 包 于 ， 但 是 一 般 情 
况 都 这 么 做 ， 请 读者 也 追随 这 个 习惯 。 


当 执 行 rsend ("hello") 的 时 候 ， 原 来 已 经 被 挂 起 的 生成 器 (函数 ) 又 
被 唤醒 ， 开 始 执行 n= (yieldn) ， 并 将 send() 方 法 发 送 的 值 返回 ， 这 就 
是 在 运行 后 能 够 为 生成 器 提供 值 的 含义 。 

如 果 接 下 来 再 执行 r.next() 会 怎样 ? 


>> r.next() 


什么 也 没有 ， 其 实 就 是 返回 了 None。 按 照 前 面 的 叙述 ， 这 次 执行 
r.next()， 由 于 没有 给 函数 的 参数 传 入 任何 值 ，yield 返 回 的 就 只 能 是 
None. 

还 要 注意 ，send() 方 法 必须 在 生成 恬 运 行 后 并 挂 起 才能 使 用 ， 即 yield 至 
少 被 执行 一 次 。 如 采 像 下 面 一 样 承 要 报错 了 。 


>>> s = repeater(5) 


TypeError: can't send non-None value to a just-started generator 


承接 上 面 的 操作 ， 如 果 将 send0) 的 参数 设 为 None， 束 会 把 刚才 输入 的 
数值 返回 。 


>>> s.send(None) 
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此 外 ， 还 有 两 个 方法 : close() 和 throw()。 


。throw (type，value=None，traceback=None) : 用 于 在 生成 器 内 部 
(生成 器 的 当前 挂 起 处 或 未 启动 时 在 定义 处 ) 抛 出 一 个 异常 (在 
yield 表 达 式 中 ) 。 

。 close(): 调用 时 不 用 参数 ， 用 于 关闭 生成 右 。 


本 节 最 后 一 句 : 你 在 编程 中 ， 当 然 可 以 不 用 生成 器 。 

Pav a 壮 : 已 ES 心 征 

第 5 和 章 ” 稍 放 和 异 香 

对 于 程序 报错 已 经 看 到 过 好 多 次 了 ， 那 些 错 误 都 可 以 归 类 为 “错误 和 异 

常 问题 ”。 本 章 束 要 对 程序 运行 中 出 现 的 错误 和 异常 进行 认真 研究 ， 近 

距离 观察 它们 的 特点 。 

5.1 错误 

程序 员 在 编写 程序 的 时 候 ， 错 误 往 往 是 难以 避免 的 ， 可 能 是 因为 语法 

用 错 了 ， 也 可 能 是 拼写 错 了 ， 当 然 还 可 能 有 其 他 莫名 其 妙 的 错误 ， 比 

0 的 了 等 。 总 之 ， 编 程 中 有 相当 一 部 分 就 是 要 不 停 地 修 
背 误 。 


Python 中 的 常见 错误 之 一 是 语法 错误 (syntax errors) ， 也 是 常见 的 错 
误 比如 : 


上 面 那 句 话 因为 缺少 冒号 “:” (英文 半角 ) ， 导 致 解释 器 无 法 解释 ， 于 
是 报错 。 这 个 报错 行为 是 由 Python 的 语法 分 析 器 完成 的 ， 并 且 检 测 到 
了 错误 所 在 文件 和 行 号 (File"<stdin>"，line 1) ， 还 以 向 上 箭头 “人 标 
识 错误 位 置 ， 最 后 一 行 显示 错误 类 型 。 

种 见 错误 之 二 是 在 没有 语法 错误 时 ， 会 出 现 逻 辑 错 误 。 逻 辑 销 误 可 能 
会 由 于 不 完整 或 者 不 合法 的 输入 导致 ， 也 可 能 是 无 法 生成 、 计 算 等 ， 
或 者 是 其 他 逻辑 问题 。 


当 Python 检测 到 一 个 各 误 时 ， 解 释 亏 驶 无 法 继续 执行 下 去 ， 于 是 抛 出 
相应 的 信息 ， 这 些 信 息 我 们 获 统 地 称 之 为 异常 信息 。 


5.2 ”异常 


看 一 个 异常 (让 0 做 分 母 了 ， 小 学 生 都 知道 会 有 异常 ) : 


>>> 1/0 


Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


ZeroDivisionError: integer division or modulo by zero 


当 Python 抛 出 异常 的 时 候 ， 首 先 “ 跟 踪 记 录 (Traceback) ”， 还 可 以 给 
它 取 一 个 更 优雅 的 名 字 “ 回 滴 ”， 然 后 才 显 示 异 常 的 详细 信息 ， 标 明 异 
常 所 在 位 置 (文件 、 行 或 某 个 模块 。 最 后 一 行 是 错误 类 型 以 及 导致 
异 惫 的 原因 。 


第 见 的 异常 如 表 5-1 所 示 。 


表 5-1 常见 的 异常 


描 述 
NameE1ror 尝试 访问 一 个 没有 申明 的 变量 


ZeroDivisionError 除数 为 0 


SyntaxError 语法 错误 


IndexError 索引 超出 序列 范围 

KeyError 请 求 一 个 不 存在 的 字典 关键 字 

IOE1ror 输入 /输出 错误 (比如 你 要 读 的 文件 不 存在 ) 
AttributeEITOT 尝试 访问 未 知 的 对 象 属性 


为 了 能 够 深入 理解 ， 依 次 举例 ， 展 示 异 币 的 出 现 条 件 和 结 采 。 


e。 NameError 


>>> bar 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


NameError: name 'bar' is not defined 


Python 中 虽然 不 需要 在 使 用 变量 之 前 和 多 声明 类 型 ， 但 也 需要 对 变量 进 
行 赋值 ， 然 后 才能 使 用 ， 不 被 赋值 的 变量 ， 不 能 在 Python 中 存在 ， 因 
为 变量 相当 于 一 个 标签 ， 要 把 它 贴 到 对 象 上 才 有 意义 。 


e。 ZeroDivisionError 


>>> /0 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


ZeroDivisionError: integer division or modulo by zero 


你 或 许 有 足够 信心 ， 貌 似 这 样 侧 单 的 错误 在 你 的 编程 中 是 不 会 出 现 
的 ， 但 在 实际 情境 中 ， 可 能 没有 这 么 容易 识别 ， 所 以 ， 依 然 要 小 心 。 


。 SyntaxError 


>>> for i in range(10) 
File "<stdin>", line 1 
for i in range(10) 
人 


SyntaxError: invalid syntax 


这 种 错误 发 生 在 Python 代码 编译 的 时 候 ， 当 编译 到 这 一 句 时 ， 解 释 器 
不 能 将 代码 转化 为 Python 字 广 码 束 报 错 ， 它 是 在 程序 运行 之 前 出 现 


的 。 现 在 有 不 少 编辑 需 都 有 语法 校 验 功能 ， 在 你 写 代 码 的 时 候 殴 能 显 
示 出 语法 的 正 误 ， 这 多 少 会 对 编程 者 有 帮助 。 


。 IndexError 
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>>> a[4] 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


IndexError: list index out of range 


>>> d = {"python":"itdiffer.com"} 

>>> d["java"] 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


KeyError: 'java' 


这 两 个 都 属于 “鸡蛋 里 面 挑 骨 头 " 类 型 一 定 得 报错 了 。 不 过 在 编程 实 
上 中 特别 是 条 环 的 时 候 ， 沉 党 由 于 箱 环 条 件 设置 不 合理 出 现 这 种 类 
型 的 错误 。 


e [OError 


>>> f = open("foo") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


IOError: [Errno 2] No such file or directory: 'foo' 


如 果 你 确认 有 文件 ， 就 一 定 要 把 路 径 写 正确 ， 因 为 你 并 没有 告诉 
Python 要 对 你 的 Computer 进 行 全 身 搜查 。Python 只 会 按照 你 指定 的 位 
置 去 找 ， 找 不 到 束 异 常 。 


。 AttributeError 


>>> class A(object): pass 


>>> a = A() 

>>> a.foo 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


AttributeError: 'A' object has no attribute 'foo' 


属性 不 存在 ， 出 现 错误 。 


Python 内 建 的 异 浓 也 不 仅仅 是 上 面 几 个 ， 上 面 只 是 列 出 常见 的 异常 中 
JL TE 


>>> range("aaa") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: range() integer end argument expected, got str. 


总 之 ， 如 果 读 者 在 调试 程序 的 时 候 遇 到 了 腊 常 ， 不 要 慌张 ， 这 是 好 事 
情 ， 是 Python 在 帮助 你 修改 错误 。 只 要 认真 阅读 异常 信息 ， 再 用 
dir0、help0 或 者 官方 网 站 文档 、Google 等 来 协助 ， 一 定 能 解决 问题 。 


5.3 处理 异 常 
在 一 段 程序 中 ， 为 了 能 够 让 程序 健壮 ， 有 时 还 要 处 理 异 常 。 举 例 : 


#!/usr/bin/env python 


# coding=utf-8 


while 1: 
print "this is a division program." 
c= raw input("input 'c' continue, otherwise logout:") 
fo se "Cs 
a = raw input("first number:") 
b = raw_input("second number:") 
try: 


print float(a)/float(b) 


except ZeroDivisionError: 


print "The second number can't be zero!" 


运行 这 段 程序 ， 显 示 如 下 过 程 : 


$ python 21601.py 

this is a division program. 

input 'c' continue, otherwise logout:c 
first number:5 


second number:2 


交 炎 炎炎 类 光 类 次 天 次 光 次 光 炊 次 类 次 光裕 光 类 江天 光 天 


this is a division program. 


input 'c' continue, otherwise logout:c 
first number:5 

second number:0 

The second number can't be zero! 

奖 尖 次 容 次 央 次 容光 内容 内 关内 次 内 类 次 突 次 类 次 奖 关 

this is a division program. 

input 'c' continue, otherwise logout:d 


$ 


从 运行 情况 看 ， 当 在 第 二 个 数 ， 即 除数 为 0 时 ， 程 序 并 没有 因为 这 个 错 
误 而 俘 止 ， 而 是 给 用 户 一 个 友好 的 提示 ， 让 用 户 有 机 会 改正 错误 。 这 

完全 得 益 于 程序 中 "处 理 异 党 ”的 设置 ， 如 果 没 有 "处理 异常 ”>， 则 当 异 

常 出 现时 就 会 导致 程序 中 止 。 


S31 trysexcept., 


对 于 前 述 举 例 程 序 ， 只 看 try 和 except 部 分 ， 如 果 没 有 异常 发 生 ，except 
子 句 在 try 语 句 执 行 之 后 被 忽略 ; 如果 try 子 句 中 有 异常 发 生 ， 该 部 分 的 
人 直接 跳 到 except 部 分 ， 执 行 其 后 面 指定 的 异常 类 型 


except 后 面 也 可 以 没有 任何 异常 类 型 ， 即 无 异常 参数 。 如 果 这 样 ， 不 
论 try 部 分 发 生 什么 异常 ， 都 会 执行 except 。 


ee 中 ， 可 以 根据 异常 或 者 别 的 需要 ， 进 行 更 多 的 操作 。 比 
站: 


#!/usr/bin/env python 


SN 


# coding=utf-8 


class Calculator(object ) : 
is_raise = False 
def calc(self, express): 
tr 
return eval(express) 
except ZeroDivisionError: 
if self.is_raise: 
print "zero can not be division." 
else: 


raise 


先 解释 函数 eval()， 它 的 含义 是 : 


eval(...) 


eval(source[, globals[, locals]]) -> value 


Evaluate the source in the context of globals and locals. 

The source may be a string representing a Python expression 

or a code object as returned by compile(). 

The globals must be a dictionary and locals can be any mapping, 
defaulting to the current globals and locals. 


If only globals is given, locals defaults to it. 


例如 : 


>3> VAL("3+5") 
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另外 ， 在 except 子 句 中 ， 还 有 一 个 孤零零 的 raise， 作 为 单独 一 个 语句 ， 
它 的 含义 是 将 异常 信息 抛 出 ， 并 且 except 子 句 用 了 一 个 判断 语句 ， 根 
据 不 同 的 情况 确定 走 不 同 的 分 文 。 


if name == "main__" 


c = Calculator() 


print c.calc("8/0") 


故意 出 现 0 做 分 母 的 情况 ， 束 是 要 让 上 is_raise=False， 则 会 : 


$ python 21602.py 
Traceback (most recent call last): 
File "21602.py", line 17, in <module> 
print c.calc("8/0") 
File "21602.py", line 8, in calc 


return eval(express) 


File "<string>", line 1, in <module> 


ZeroDivisionError: integer division or modulo by zero 


如 果 将 is_raise 的 值 改 为 True， 会 是 这 样 : 


让 name == "main__" 


c = Calculator() 
c.is_raise = True 


print c.calc("8/0") 


运行 结果 : 


$ python 21602.py 


zero can not be division. 


None 


最 后 的 None 是 c.calc ("8/0") 的 返回 值 ， 因 为 有 print c.calc ("8/0") ， 
所 以 被 打印 出 来 。 


5.3.2 ”处 理 多 个 异常 


处 理 多 个 异常 并 不 是 因为 同时 报 出 多 个 异常 ， 程 序 在 运行 中 ， 只 要 明 
到 一 个 异 毅 融会 有 反应 ， 所 以 ， 每 次 捕获 到 的 异 稼 一 定 是 一 个 。 所 谓 
由 不 同 的 except 子 
后] 处理 。 


#!/usr/bin/env python 


# coding=utf-8 


while 1: 
print "this is a division program." 
c= raw input("input 'c' continue, otherwise logout:") 
I 
a = raw input("first number:") 
b = raw_input("second number:") 
try: 


print float(a)/float(b) 


except ZeroDivisionError: 


print "The second number can't be zero!" 


except ValueError: 


print "please input number." 


修改 一 下 程序 ， 增 加 了 一 个 except 子 句 ， 目 的 是 当 用 户 输入 的 不 是 数 
字 时 ， 捕 获 并 处 理 这 个 异常 。 测 试 如 下 : 


$ python 21701.py 

this is a division program. 

input 'c' continue, otherwise logout:c 
first number:3 


second number:"hello" # 输 入 了 一 个 不 是 数字 的 东西 


please input number. # 对 照 上 面 的 程序 ， 捕 获 并 处 理 了 这 个 异常 


次 次 交 风 内资 关 次 央 闪 次 内 次 内 大 央 内 次 尖 次 凡 让 凡 认 


this is a division program. 


input 'c' continue, otherwise logout:c 
first number:4 
second number:0 


The second number can't be zero! 


认 淆 突 容 兴 风灾 内 沉 央 内 容光 内 内 容 风灾 内 容光 突 容 内 内 
this is a division program. 


input 'c' continue, otherwise logout:4 


如 果 有 多 个 except，try 里 面 直 到 一 个 异常 ， 就 转 到 相应 的 except 子 句 ， 
其 他 的 忽略 。 如 果 except 没 有 相应 的 异常 ， 该 异常 也 会 抛 出 ， 不 过 这 
时 程序 束 要 中 止 了 ， 因 为 异常 “ 浮 出 ”程序 顶部 。 


除了 用 多 个 except 之 外 ， 还 可 以 在 一 个 except 后 面 放 多 个 异常 参数 ， 比 
如 上 面 的 程序 ， 可 以 将 except 部 分 修改 为 : 


except (ZeroDivisionError, ValueError): 


print "please input rightly." 


We 和 —[h, 
运行 的 结果 就 是 : 
$ python 21701.py 
this is a division program. 
input 'c' continue, otherwise logout:c 
first number:2 
second number:0 # 捕 获 异 常 
please input rightly. 
认 淆 灾 突 内 风 突 容 浴 淆 内 内 央 风灾 内 内 灾 内 兴 
this is a division program. 
input 'c' continue, otherwise logout:c 
first number:3 
second number:a # 异 常 
please input rightly. 
内 风灾 内 浴 风 突 突 内 风灾 容光 央 风 内 风灾 内 内 
this is a division program. 


input 'c' continue, otherwise logout:d 


需要 注意 的 是 ，except 后 面 如 采 是 多 个 参数 ， 一 定 妥 用 圆 括号 包 囊 起 
来 。 否 则 ， 后 采 目 负 。 


在 对 异常 的 处 理 中 ， 前 面 都 是 目 己 写 一 个 提示 语 ， 但 目 己 写 的 不 如 内 
置 的 异 稼 错误 提示 好 ， 如 采 布 望 把 默认 错误 提示 打印 出 来 ， 但 程序 还 


不 能 中 断 ， 怎 么 办 ? Python 提供 了 一 种 方式 ， 将 上 面 的 代码 修改 如 


while 1: 
print "this is a division program." 
c= raw input("input 'c' continue, otherwise logout:") 
if c == 'c': 
a = raw input("first number:") 
b = raw_input("second number:") 
Lr 
print float(a)/float(b) 
呈 容 洋洋 次 内 次 兴 次 风 类 次 突 容 兴 次 次 内 闪 突 交 内 闪闪 类 兴 用 
except (ZeroDivisionError, ValueError), e: 


print e 


人 次 炎 次 炎 次 光 炎 次 类 次 光 凑 光 类 光 天 光 天 次 光 目 


运行 一 下 ， 看 看 提示 信息 。 


$ python 21702.py 

this is a division program. 

input 'c' continue, otherwise logout:c 

first number:2 

second number:a # 异 常 
could not convert string to float: a 

淆 疾风 风 奖 闪闪 突 关内 次 次 炎 兴 次 奖 类 次 突 闪 

this is a division program. 

input 'c' continue, otherwise logout:c 

first number:2 

second number:0 # 异 常 
float division by zero 

奖 关 内 风 次 闪 次 突 次 内 次 次 关内 次 奖 类 奖 突 闪 

this is a division program. 


input 'c' continue, otherwise logout:d 


在 Python 3.x 中 ， 常 常 这 样 写 : except (ZeroDivisionError， 
ValueError) as e: 


在 上 面 的 程序 中 ， 只 处 理 了 两 个 异常 ， 还 可 能 有 更 多 的 异常 ， 如 来 要 
处 理 ， 怎 么 办 ? 可 以 这 文 样 : execpt: 或 者 except Exception，e， 后 面 什么 
参数 也 不 写 葡 好 了 。 


5.3.3 ”else 子 句 


有 了 try...except.….， 在 一 般 情 况 下 是 够 用 的 ， 但 总 有 不 一 般 的 时 候 出 
现 ， 所 以 ， 束 增加 了 一 个 else 子 句 。 其 实 ， 人 类 的 目 然 语言 何 莹 不 是 
如 此 呢 ? 总 要 根据 需要 添加 不 少 东 西 。 


>>> try: 


print "I am try" 
except: 
print "I am except" 
“LS 


print "I am else" 


I am try 


I am else 


这 段 演示 能 够 帮助 读者 理解 else 的 执行 特点 。 如 果 执行 了 ty， 则 except 
被 忽略 ， 但 是 else 被 执行 。 


print 1/0 


这 时 候 else 束 不 被 执行 了 。 
理解 了 else 的 执行 特点 ， 可 以 写 这 样 一 段 程序 ， 还 是 类 似 于 前 面 的 计 


算 ， 只 是 如 果 输 入 的 有 误 ， 束 不 断 要 求 重 新 输入 ， 直 到 输入 正确 并 得 
到 了 结果 ， 才 不 再 要 求 输入 内 容 ， 然 后 程序 结束 。 


0 
结果 如 何 。 


#!/usr/bin/env python 
# coding=utf-8 
while 1: 
Try 
x = raw input("the first number:") 


y = raw_input("the second number:") 


r= float(x)/float(y) 


print r 


except Exception, e: 
print e 
print "try again." 
else: 


break 


先 看 运行 结果 : 


$ python 21703.py 

the first number :2 

the second number :0 # 异 常 ， 执 行 except 
float division by zero 

try again. # 循 环 


the first number:2 


the second number:a # 异 常 

could not convert string to float: a 

try again. 

the first number:4 

the second number:2 # 正 常 ， 执 行 try 

2.0 # 然 后 else: break， 退 出 程序 


相当 满意 的 执行 


程序 HJ“except Exception, e” 的 含义 是 不 管 什么 异常 ， 这 里 都 会 捕 
获 ， 并 且 传 给 变量 e， 然 后 用 print e 把 异常 信息 打印 出 来 。 


5.3.4 ”finally 子 句 
finally 了 于 人 名， Re 中 感 并 所 , 是 做 善 ee 


。 因此 有 一 宰 说 法 是 将 finally 用 在 可 和 的 异常 后 进 行 清 a 比如 : 


>>> x = 10 


>>> try: 
x = 1/0 
.. except Exception, e: 
print e 
.. finally: 
print "del x" 


del x 


integer division or modulo by zero 


del x 


看 一 看 x 是 否 被 删除 ? 


>>> x 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


0 在 应 用 中 可 以 将 上 面 的 各 个 子 句 都 综合 起 来 使 用 ， 写 成 如 下 样 


ry 
do something 
except: 
do something 
else: 
do something 


finally 


do something 


看 到 了 这里， 你 是 不 是 觉得 这 个 “try...except...” 跟 “if...else...” 有 点 相似 
ee ， 他 们 的 存在 都 是 有 道 
于 


5.3.5 ” assert 语句 


>>> assert 1==1 

>>> assert 1==0 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


AssertionError 


从 上 面 的 举例 中 可 以 基本 了 解 assert 的 特点 。 


翻译 过 来 是 “断言 "之 意 。assert 是 语句 等 价 于 布尔 真 的 判定 ， 发 
常 就 意味 着 表达 式 为 假 。 


assert 的 应 用 情景 与 其 翻译 的 意思 "断言 > 一样， 即 当 程序 运行 到 某 个 克 
点 的 时 候 ， 束 断定 某 个 变量 的 值 必然 是 什么 ， 或 者 对 象 必然 拥有 某 个 
属性 等 ， 简 单 说 就 是 断定 什么 东西 必然 是 什么 ， 如 果 不 是 ， 就 抛 出 错 


误 。 


#!/usr/bin/env python 


# coding=utf-8 


class Account(object ) : 
def _ init (self, number): 
self.number = number 


self.balance = 0 


口 
加 
+ 


deposit(self, amount): 
assert amount > 0 


self.balance += balance 


def withdraw(self, amount): 
assert amount > 0 
if amount <= self.balance: 
self.balance -= amount 
else: 


print "balance is not enough." 


程序 中 ，deposit() 和 withdraw0 方 法 的 参数 amount 值 必须 是 大 于 零 的 ， 
这 里 束 用 断言 ， 如 果 不 满 足 条 件 就 会 报错 。 比 如 这 样 来 运行 : 


if name == "main__" 


a = Account(1000) 


a.deposit(-10) 


出 现 的 结果 是 : 


$ python 21801.py 
Traceback (most recent call last): 
File "21801.py", line 22, in <module> 
a.deposit(-10) 
File "21801.py", line 10, in deposit 
assert amount > 0 


AssertionError 


这 束 是 断言 assert 的 作用 。 什 么 是 使 用 断言 的 最 佳 时 机 ? 


。 如 采 没 有 特别 的 目的 ， 断 言 应 该 用 于 如 下 情况 : 
防御 性 的 编程 。 

。 运行 时 对 程序 逻辑 的 检测 。 

。 合约 性 检查 (比如 前 置 条 件 ， 后 置 条 件 ) 。 
程序 中 的 常量 。 

。 检 查 文 档 。 


(上 述 要 点 来 和 目 《Python 使 用 断言 的 最 佳 时 机 》 网 址 : 


http://www.oschina.net/translate/when-to-use-assert) 


不 论 是 否 理解 ， 都 要 先 看 看 ， 请 牢记 ， 在 具体 的 开发 过 程 中 ， 有 时 间 
束 看 看 本 书 ， 不 断 加 深 对 这 些 概 念 的 理解 ， 这 也 是 master 的 成 束 之 


Bs 


下 


引用 危机 百科 中 对 “ 异 当 处理” 词 条 的 说 明 ， 作 为 对 “错误 和 异 
崩 ” 部 分 的 总 结 (有 所 删改 ) : 


各 处 理 是 编程 语言 或 计算 机 硬件 里 的 一 种 机 制 ， 用 于 处 理 软件 或 信 
统 中 出 现 的 异常 状况 〈 即 超出 程序 正常 执行 流程 的 某 些 特殊 条 


I 


广 汪 各 ”和 缴 池 
一 洪 迁 


各 种 编程 语言 在 处 理 异常 方面 具有 非常 显著 的 不 同 点 (错误 检测 与 异 
常 处 理 的 区 别 在 于 ， 错误 检测 是 在 正常 的 程序 流 中 ， 处 理 不 可 预见 问 
题 的 代码 ， 例 如 一 个 调用 操作 未 能 成 功 结束 ) 。 某 些 编程 语言 有 这 样 
的 函数 : 当 输 入 存在 非法 数据 时 不 能 被 安全 地 调用 ， 或 者 返回 值 不 能 
与 异常 进行 有 效 的 区 别 。 例 如 ，C 语 言 中 的 atoi 函 数 〈 从 ASCII 串 到 整 
数 的 转换 ) 在 输入 非法 时 可 以 返回 0。 在 这 种 情况 下 编程 者 需要 另外 进 
行 错误 检测 《可 能 通过 某 些 辅助 全 局 变量 ， 如 C 的 errno) ， 或 进行 输 
入 检验 (如 通过 正则 表达 式 ) ， 或 者 共同 使 用 这 两 种 方法 。 

通过 异常 处 理 ， 我 们 可 以 对 用 户 在 程序 中 的 非法 输入 进行 控制 和 提 
示 ， 以 防 程 序 骨 演 。 

从 进程 的 视角 来 看 ， 硬 件 中 断 相 当 于 可 恢复 异 币 ， 虽 然 中 断 一 般 与 程 
序 流 本 身 无 天 。 


从 子 程序 编程 者 的 视角 来 看 ， 异 党 是 很 有 用 的 一 种 机 制 ， 用 于 通知 外 
界 该 子 程序 不 能 正常 执行 ， 如 输入 的 数据 无 效 〈 例 如 除数 是 0) ， 或 所 
需 资 源 不 可 用 (例如 文件 丢失 ) 。 如 采 系 统 没有 异常 机 制 ， 则 编程 者 
需要 用 返回 值 来 标示 发 生 了 哪些 错误 。 


Python 语 言 对 异常 处 理 机 制 是 非常 普遍 深入 的 ， 所 以 想 写 出 不 舍 try、 
except 的 程序 非常 困难 。 


第 6 章 ”模块 


随 着 对 Python 学 习 的 深入 ， 其 优点 日 渐 突 出 ， 让 读者 也 感觉 到 Python 
的 强大 了 ， 强 大 感觉 之 一 驶 是 “模块 目 信 ”， 因 为 Python 不 仅 有 目 融 的 
模块 〈 称 之 为 标准 库 ) ， 还 有 海量 的 第 三 方 模块 ， 并 且 很 多 开发 者 还 
在 不 断 页 献 自 己 开发 的 新 模块 ， 正 是 有 了 这 么 强大 的 “模块 自信 ”， 
Python 才 被 很 多 人 钟爱 。 并 且 这 种 方式 也 正在 不 断 被 其 他 更 多 语言 所 
借鉴 ， 几 乎 成 为 普 世 行 为 了 (不 知道 Python 是 不 是 首倡 者 ) 。 


“模块 目 信 ? 的 本 质 是 : 开放。 


Python 不 是 一 个 封闭 的 体系 ， 而 是 一 个 开放 系统 。 开 放 系 统 的 最 大 好 
处 束 是 避免 了 “ 炉 增 ”。 


业 的 概念 是 由 德国 物理 学 家 克 劳 修 斯 于 1865 年 所 提出 ， 古 一 种 测量 在 
动力 学 方面 不 能 做 功 的 能 量 总 数 ， 也 天 是 当 总 体 的 精 增 加 ， 其 做 功能 
力也 下 降 ， 粒 的 量度 正 是 能 量 退化 的 指标 。 


人 于 计算 一 个 系统 中 的 失 序 现象 ， 也 束 是 计算 该 系统 混乱 的 程 


根据 焙 的 统计 学 定义 ， 热 力学 第 二 定律 说 明 一 个 孤立 系统 倾向 于 增加 
混乱 程度 。 换 名 话说 承 是 对 于 封 财 系统 而 言 ， 会 越 来 越 趋 癌 于 无 序 
化 。 反 过 来 ， 开 放 系 统 则 能 避免 无 序 化 。 


6.1 编写 模块 


想必 读者 已 经 熟悉 了 import 语 句 ， 曾 经 有 这 样 一 个 例子 : 


>>> import math 


>>> math .pow(3,2) 


9.0 


这 里 的 math 〈《 征 Python 标准 库 之 一 ， 在 本 章 ， 我 们 要 逐渐 理解 模块 、 
库 之 类 的 术语 。) 就 是 一 个 模块 ， 用 import 引 入 这 个 模块 ， 然 后 可 以 
使 用 模块 里 面 的 函数 ， 比 如 pow0 函 数 。 显 然 ， 这 里 是 不 需要 目 己 动手 
写 具 体 函 数 的 ， 我 们 的 任务 束 古 拿 过 来 使 用 。 这 束 是 模块 的 好 处 ， 拿 
过 来 束 用 ， 不 用 目 己 重 写 。 


6.1.1 模块 是 程序 


“模块 是 程序 ”一 语 道 破 了 模块 的 本 质 ， 它 就 是 一 个 扩展 名 为 .py 的 
Python 程 序 。 


我 们 能 够 在 应 该 使 用 它 的 时 候 将 它 引 用 过 来 ， 节 省 精力 ， 不 需要 重 写 
雷同 的 代码 。 


但 是 ， 如 采 我 目 己 写 一 个 .py 文件 ， 是 不 是 残 能 作为 模块 import 过 来 
呢 ? 还 不 那么 简单 。 必 须 得 让 Python 解 释 锅 能够 找到 你 写 的 模块 。 比 
如 ， 在 某 个 目录 中 ,我 写 了 这 样 一 个 文件 : 


#!/usr/bin/env python 
# coding=utf-8 


并 把 它 命名 为 pm.py， 那 么 这 个 文件 就 可 以 作为 一 个 模块 被 引入 。 不 过 
由 于 这 个 模块 是 我 自己 写 的 ，Python 解 释 器 并 不 知道 ， 得 先 告诉 它 我 
写 了 这 样 一 个 文件 。 


>>> import sys 


>>> sys.path.append("~/Documents/VBS/StartLearningPython/2code/pm.py") 


用 这 种 方式 告诉 Python 解 释 器 ， 我 写 的 那个 文件 在 哪里 。 在 这 个 方法 
中 ， 也 用 了 模块 import sys， 不 过 由 于 sys 是 Python 标 准 库 之 一 ， 所 以 不 


用 特别 告诉 Python 解 释 絮 其 位 置 。 


上 面 那 个 一 长 串 的 地 址 是 Ubuntu 系统 的 地 址 格式 ， 如 果 读 者 使 用 的 是 
Windows 系 统 ， 请 写 你 所 保存 的 文件 路 径 。 


>>> import pm 
>>> pm.lang 


'python' 


在 pm.py 文 件 中 有 一 个 赋值 语句 ， 即 lang="python"， 现 在 将 pm.py 作 为 

模块 引入 (注意 作为 模块 引入 的 时 候 不 带 扩 展 名 ) ， 就 可 以 通过 “模块 
名 字 ”+“.”+“ 属 性 或 方法 名 称 ” 来 访问 pm.py 中 的 东西 。 当 然 ， 如 果 要 访 
问 不 存在 的 属性 ， 肯 定 是 要 报错 的 。 


请 读者 回 到 pm.py 文 件 的 存储 目录 ， 查 看 一 下 是 不 是 多 了 一 个 扩展 名 
是 .pyc 的 文件 ? 


解释 器 ， 英 文 是 : interpreter， 在 Python 中 ， 它 的 作用 就 是 将 .py 的 文件 
转化 为 .pyc 文 件 ， 而 .pyc 文 件 是 由 字 节 码 (bytecode) 构成 的 ， 然 后 计 
算 机 执行 .pyc 文 件 。 


很 多 人 襄 欢 将 这 个 世界 简化 再 人 简化， 比如 编程 语言 就 分 为 解释 型 和 编 
译 型 ， 不 但 如 此 ， 还 将 两 种 类 型 的 语言 分 别 贴 上 运行 效率 高 低 的 标 
签 ， 解 释 型 的 运行 速度 就 慢 ， 编 译 型 的 运行 速度 就 快 。 一 般 人 都 把 
Python 看 成 是 解释 型 的 ， 于 是 嗣 得 出 它 运行 速度 慢 的 绪论。 不 少 人 都 
因此 上 当 受 锋 了 ， 认 为 Python 不 值得 学 ， 或 者 做 不 了 什么 “大 事 *”。 这 
束 定 将 本 来 复杂 的 、 多 样 化 的 世界 非得 划分 为 墨 日 ”的 结果 ， 喜 欢 
用 * 非 此 即 彼 ”的 思维 方式 考虑 问题 。 


i “敌人 的 政信 就 是 朋友 ”是 幼稚 的 ,，“ 一 分 为 二 ”是 机 械 


如 同 刚 才 看 到 的 那个 .pyc 文 件 一 样 ， 当 Python 解 释 句 读 取 了 .py 文件 ， 
先 将 它 变 成 由 字 市 码 组 成 的 .pyc 文 件 ， 然 后 这 个 .pyc 文 件 交 给 一 个 叫 作 
Python 虚拟 机 的 东西 去 运行 (那些 号 称 编译 型 的 语言 也 是 这 个 流程 ， 


不 同 的 是 它们 先 有 一 个 明显 的 编译 过 程 ， 编 译 好 了 之 后 再 运行 ) 。 如 
人 Python 解 释 絮 会 重新 编译 ， 只 是 这 个 编译 过 程 不 全 
还 人 小 绍 避 和 有朋 ° 


有 了 了 .pyc 文件 后 ， 每 次 运行 束 不 需要 重 狐 让 解释 絮 来 编译 .py 文件 了 ， 
人 。 这样 ，Python 运 行 的 束 是 那个 编译 好 了 的 .pyc 文 


是 否 还 记得 前 面 写 有 关 程 序 然 后 执行 时 常常 要 用 到 
if_name ==" main _"， 那 时 我 们 直接 用 “python filename.py” 的 格式 
来 运行 该 文件 ， 此 时 我 们 也 同样 有 了 .py 文件 ， 不 过 是 作为 模块 引入 
的 。 这 就 得 深入 探究 一 下 ， 同 样 是 .py 文件 ， 它 怎么 知道 是 被 当 作 程 序 
执行 还 是 被 当 作 模块 引入 ? 


为 了 便于 比较 ， 将 pm.py 文 件 进行 改造 。 


#!/usr/bin/env python 


# coding=utf-8 


def lang() 
ret "pyth 
if _ name == 
print lang() 
沿用 先前 的 做 法 : 


$ python pm.py 
python 


如 琳 将 这 个 程序 作为 模块 ， 导 入 ， 会 古 这 样 的 : 


>>> import sys 

>>> sys.path.append("~/Documents/VBS/StarterLearningPython/2code/pm.py") 
>>> import pm 

>>> pm.1lang() 


'python' 


查看 模块 属性 和 方法 ， 可 以 使 用 dir()。 


>>> dir(pm) 


['_builtins __', '_doc _', '_ file _', '_ name _', '_ package _', 'lang'] 


， 一 个 .py 文件 ， 可 以 把 它 当 作 程 序 来 执行 ， 也 可 以 将 它 作为 模块 引 


如 果 要 作为 程序 执行 ， 则 _name _=="_main “"; 如 果 作 为 模块 引 
入 ， 则 pm. name_=="pm"， 即 变量 _name_ 的 值 是 模块 名 称 。 


用 这 种 方式 就 可 以 区 分 是 执行 程序 还 是 作为 模块 引入 了 。 
在 一 般 情 况 下 ， 如 果 仅 仅 是 用 作 模 块 引 入 ， 不 必 写 

if name ==" main "?° 

6.1.2 ”模块 的 位 置 


为 了 让 我 们 自己 写 的 模块 能 够 被 Python 解释 器 知道 ， 需 要 用 
sys.path.append 

("~/Documents/VBS/StarterLearningPython/2code/pm.py") 。 其 实 , 在 
Python 中 ， 所 有 模块 都 被 加 入 到 了 sys.path 里 面 。 用 下 面 的 方法 可 以 看 
到 模块 所 在 位 置 : 


>>> import sys 


>>> import pprint 

>>> pprint.pprint(sys.path) 

| 
'/usr/local/lib/python2.7/dist-packages/autopep8-1.1-py2.7.egg', 
'/usr/local/lib/python2.7/dist-packages/pep8-1.5.7-py2.7.egg', 
'/usr/lib/python2.7°', 
'/usr/lib/python2.7/plat-i386-linux-gnu', 
'/usr/lib/python2.7/1ib-tk', 
'/usr/lib/python2.7/1ib-old', 
'/usr/lib/python2.7/1ib-dynload', 
'/usr/local/lib/python2.7/dist-packages', 
'/usr/lib/python2.7/dist-packages', 
'/usr/lib/python2.7/dist-packages/PILcompat', 


'/usr/lib/python2.7/dist-packages/gtk-2.0" 


'/usr/lib/python2.7/dist-packages/ubuntu-sso-client', 


'~/Documents/VBS/StarterLearningPython/2code/pm.py'] 


从 中 也 发 现 了 我 目 己 写 的 那个 文件 。 


凡 在 上 面 列表 所 包括 位 置 内 的 .py 文件 都 可 以 作为 模块 引入 。 不 妨 举 个 
例子 ， 把 前 面 自己 编写 的 pm.py 文 件 修改 为 pmlib.py， 然 后 复制 

到 '/usr/ib/python2.7/dist-packages 中 。 (这 是 以 Ubuntu 为 例 说 明 ， 如 果 
是 其 他 操作 系统 ， 读 者 用 类 似 方法 也 能 找到 。) 


[sudo] password for qw: 


$ 1s /usr/lib/python2.7/dist-packages/pm* 


/usr/1lib/python2.7/dist-packages/pmlib.py 


文件 放 到 了 指定 位 置 。 看 下 面 的 : 


>>> import pmlib 


>>> pmlib.lang 
<function lang at 0xb744372c> 
>>> pmlib.1lang() 


'python' 


将 模块 文件 放 到 指定 位 置 是 一 种 不 错 的 方法 ， 但 感觉 此 法 受到 了 哲 
束 ， 程 序 员 都 喜欢 目 由 ， 能 不 能 放 到 别处 呢 ? 


当然 能 ， 用 sys.path.appendO 就 是 不 管 把 文件 放 在 哪里 ， 都 可 以 把 其 位 
置 告诉 python 解释 器 。 虽 然 这 种 方法 在 前 面 用 了 ， 但 其 实 是 很 不 常用 
的 ， 因 为 它 也 有 麻烦 的 地 方 ， 比 如 在 交互 模式 下 ， 如 果 关 闭 了 ， 再 开 
启 ， 还 得 重新 告知 。 


比较 常用 的 方法 是 设置 PYTHONPATH 环 境 变量 。 


环境 变量 ， 不 同 的 操作 系统 设置 方法 略 有 差异 。 读 者 可 以 根据 目 己 的 
操作 系统 ， 到 网 上 搜索 设置 方法 。 


以 Ubuntu 为 例 ， 建 立 一 个 Python 的 目录 ， 然 后 将 我 自己 写 的 .py 文件 放 
到 这 里 ， 并 设置 环境 变量 。 


:~$ mkdir python 


:~$ cd python 
:~/python$ cp ~/Documents/VBS/StarterLearningPython/2code/pm.py mypm.py 
:~/python$ 1s 


mypm.py 


然后 将 这 个 目录 ~/python， 即 /home/qw/python 设 置 环境 变量 。 


vim /etc/profile 


要 用 root 权 限 ， 在 打开 的 文件 最 后 增加 export 
PATH=/home/qw/python:$PAT， 然 后 保存 退出 即 可 。 
注意 ， 我 是 在 ~/python 目 录 下 输入 Python ， 然 后 进入 到 交互 模式 : 


:~$ cd python 


:~/python$ python 
>>> import mypm 


>>> mypm.1lang() 


如 此 ， 就 完成 了 告知 过 程 。 
6.1.3 all_ 在 模块 中 的 作用 
上 面 的 模块 虽然 比较 简单 ， 但 是 已 经 显示 了 编写 模块 ， 以 及 在 程序 中 


导入 模块 的 基本 方式 。 在 实践 中 ， 所 编写 的 模块 也 许 更 复杂 一 点 ， 比 
如 ， 有 这 么 一 个 模块 ， 其 文件 命名 为 pp.py 


# /usr/bin/env python 


# coding:utf-8 


public_variable = "Hello, I am a public variable." 


_private_variable = "Hi, I am a private variable." 


def public_ teacher(): 


print "I am a public teacher, I am from JP." 


def _private_ teacher(): 


print "I am a private teacher, I am from CN." 


接 下 来 束 是 熟悉 的 操作 了 ， 进 入 到 交互 模式 中 。pp.py 这 个 文件 束 旦 一 
个 模块 ， 该 模块 中 包含 了 变量 和 函数 。 


>>> import sys 

>>> sys.path.append("~/Documents/StarterLearningPython/2code/pp.py") 
>>> import pp 

>>> from pp import * 

>>> public_variable 

'Hello, I am a public variable.' 


>>> _private_variable 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


NameError: name '_private variable' is not defined 


变量 public_variable 能 够 被 使 用 ， 但 是 另外 一 个 变量 _private_variable 不 
能 被 调用 ， 先 观察 一 下 两 者 的 区 别 ， 后 者 是 以 单 下 画 线 开头 的 ， 这 样 
的 是 私有 变量 。 而 from pp import* 的 含义 是 “希望 能 访问 模块 (pp) 中 
有 权限 访问 的 全 部 名 称 ?， 那 些 被 视 为 私有 的 变量 或 者 函数 或 者 类 ， 当 
然 束 没有 权限 被 访问 了 。 


再 如 : 


>>> public_teacher() 


I am a public teacher, I am from JP. 
>>> _private_teacher() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


NameError: name '_private teacher' is not defined 


这 不 是 绝对 的 ， 但 如 果 要 访问 具有 私有 性 质 的 东西 ， 可 以 这 样 做 。 


>>> import pp 

>>> pp._private_teacher() 

I am a private teacher, I am from CN. 
>>> pp._private_variable 


'Hi, I am a private variable.' 


下 面 再 对 pp.py 文 件 进行 改写 ， 增 加 一 些 东 西 。 


# /usr/bin/env python 


# coding:utf-8 


_all = ['_private variable', 'public_ teacher'] 
public_variable = "Hello, I am a public variable." 
_private variable = "Hi, I am a private variable." 


def public_teacher(): 


print "I am a public teacher, I am from JP." 


def _private_ teacher(): 


print "I am a private teacher, I am from CN." 


在 修改 之 后 的 pp.py 中 ， 增 加 了 __all_ 变量 以 及 相应 的 值 ， 在 列表 中 包 
含 了 一 个 私有 变量 的 名 字 和 一 个 函数 的 名 字 。 这 是 在 告诉 引用 本 模块 
的 解释 右 ， 这 两 个 东西 是 有 权限 被 访问 的 ， 而 且 只 有 这 两 个 东西 。 


>>> import sys 


>>> sys.path.append("~/Documents/StarterLearningPython/2code/pp.py") 
>>> from pp import * 


>> _private_variable 


条 然 ， 曾 经 不 能 被 访问 的 私有 变量 ， 现 在 能 够 访问 了 。 


>>> public_variable 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


NameError: name 'public_ variable' is not defined 


因为 这 个 变量 没有 在 _all 的 值 中 ,虽然 以 前 曾经 被 访问 到 过 ,但 是 
现在 就 不 行 了 。 


>>> public_teacher() 


I am a public teacher, I am from JP. 

>>> _private_teacher() 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


NameError: name '_private teacher' is not defined 


这 只 不 过 是 再 次 说 明 前 面 的 结论 罢了 。 当 然 ， 如 有 果 以 import pp 引入 模 
块 ， 再 用 pp._private_teacher 的 方式 是 一 样 有 效 的 。 


6.1.4 包 和 库 


顾名思义 ， 包 和 库 都 是 比 “模块 "大 的 。 一 般 来 讲 ， 一 个 “ 包 ” 里 面 会 有 
多 个 模块 ， 当 然 ,“ 库 ?是 一 个 更 大 的 概念 了 ， 比 如 Python 标准 库 中 的 
每 个 库 都 有 好 多 个 包 ， 每 个 包 都 有 邦 干 个 模块 。 


一 个 包 由 多 个 模块 组 成 ， 即 有 多 个 .py 的 文件 ， 那 么 这 个 所 请 的 “ 包 ” 就 
古 我 们 熟悉 的 一 个 目录 既 了 。 现 在 需要 解决 如 何 引 用 菏 个 目录 中 的 模 
块 问题 。 解 决 方法 就 古 在 该 目录 中 放 一 个 _init .py 文件 。_init .py 
古 一 个 空 文件 ， 将 它 放 在 某 个 目录 中 ， 就 可 以 将 该 目录 中 的 其 他 .py 文 
件 作 为 模块 被 引用 。 


例如 ， 建 立 一 个 目录 ， 名 日 : package_qi， 里 面 依次 放 了 pm.py 和 pp.py 
两 个 文件 ， 然 后 建立 一 个 空 文件 _init .py 


接 下 来 ， 需 要 导入 这 个 包 (package_qi) 中 的 模块 。 
下 面 这 种 方法 很 清晰 明了 。 


>>> package_qi.pm.1lang() 


"python' 


下 面 这 种 方法 ， 貌 似 简短 ， 但 如 果 多 了 ， 丽 怕 难以 分 辩 。 


>>> from package_qi import pm 
>>> pm.1lang() 


'python' 


在 后 续 制作 网 站 的 实战 中 ， 还 会 经 常用 到 这 种 方式 ， 届 时 会 了 解 更 
多 。 请 你 持 兴 趣 继 续 阅 读 ， 不 要 半途 而 废 ， 不 然 疑 惑 得 不 到 解决 ， 好 
东西 整 看 不 到 了 。 


6.2 ” 目 市 电池 

“Python 目 带 ‘ 电 池 ”， 昕 说 过 这 种 说 法 吗 ? 

在 Python 被 安装 的 时 候 ， 就 有 不 少 模块 也 随 着 安装 到 本 地 的 计算 机 上 
了 。 这 些 东 西 束 如 同 “ 能 源 *、“ 电 力 ” 一 样 ， 让 Python 拥 有 了 无 限 生 
vn 能 够 非常 轻而易举 地 免费 使 用 很 多 模块 。 所 以 ， 称 之 为 “ 目 融 电 
池 ”。 

那些 在 安装 Python 时 就 默认 已 经 安装 好 的 模块 被 称 为 “标准 库 ”。 
熟悉 标准 库 是 编程 之 必须 。 

6.2.1 引用 方式 


所 有 模块 都 服从 下 述 引用 方式 ， 是 最 基本 的 、 也 是 最 单 用 的 ， 还 是 可 
读 性 非 第 好 的 : 


import modulename 


例如 : 


>>> import pprint 

>a= {"lang":"python", "book":"www.itdiffer.com", "teacher":"qiwsir", "goal":"from beginner to master"} 
>>> pprint.pprint(a) 
{'book': 'www.itdiffer.com', 

"goal': 'from beginner to master' 

'lang': 'python', 

"teacher ': 'qiwsir'} 


在 对 模块 进行 说 明 的 过 程 中 ， 以 标准 库 pprint 为 例 。 


以 pprint.pprintO 的 方式 使 用 模块 中 的 一 种 方法 ， 这 种 方法 能 够 让 字典 
格式 化 输出 。 看 看 结果 是 不 是 比 原来 更 容易 阅读 了 呢 ? 


在 import 后 面 ， 理 论 上 可 以 跟 好 多 模块 名 称 ， 但 是 在 实践 中 ， 还 是 建 
议 大 家 一 次 跟 一 个 名 称 ， 太 多 了 看 着 头晕 眼花 ， 不 容易 阅读 。 


这 是 用 import pprint 的 样式 引入 ， 并 以 点 号 “.”( 英 文 半角 ) 的 形式 引用 
其 方法 


还 有 下 面 的 方式 : 


>> from pprint import pprint 


意思 是 从 pprint 模 块 中 只 将 pprint() 引 入 ， 之 后 束 可 以 直接 使 用 它 了 。 


>>> pprint(a) 

{'book': 'www.itdiffer.com', 
"goal': 'from beginner to master' 
"Lang': "python'， 


"teacher ': 'qiwsir'} 


再 懒惰 一 些 ， 可 以 : 


from pprint import * 


将 pprint 模 块 中 的 一 切 都 引入 了 ， 于 是 可 以 像 上 面 那样 直接 使 用 每 个 函 
数 。 但 是 ， 这 样 造成 的 结果 是 可 读 性 不 是 很 好 ， 并 有 旦 ,不 管 是 不 是 用 
得 到 ， 都 拿 过 来 ， 是 不 是 太 贪 禁 了 9? 仙 禁 的 结果 是 内 存 会 消耗 不 少 。 
2 这 种 方法 可 以 用 于 帘 用 的 并 且 模 块 属 性 或 方法 不 是 很 多 的 情 

况 ， 葛 贪 梦 。 


减 然 ， 如 末 很 明确 使 用 模块 中 的 哪些 万 法 或 属性 ， 那 么 使 用 类 似 from 


modulename import namel1，name2，name3... 也 末 演 不 可 。 需 要 再 次 提 
醒 的 是 不 能 因为 引入 了 模块 而 降低 了 可 读 性 ， 让 别人 不 知道 呈现 在 眼 
前 的 方法 是 从 何 而 来 。 

有 时 候 引 入 的 模块 或 者 方法 名 称 有 点 长 ， 可 以 给 它 重 命名 


。 加: 


>>> import pprint as pr 

>>> pr.pprint(a) 

{'book': "www.itdiffer.com'， 
"goal': "from beginner to master ' 

"Lang': "python'， 


"teacher ': 'qiwsir'} 


当然 ， 还 可 以 这 样 : 
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>>> from pprint import pprint as pt 


>>> pt(a) 
{'book': 'www.itdiffer.com', 
'goal': 'from beginner to master' 


'lang': 'python’', 


"teacher ': 'qiwsir'} 


但 是 不 管 怎么 样 ， 一 定 要 让 人 看 慢 ， 且 要 过 了 若干 时 间 ， 目 己 也 还 能 
看 懂 。 记 住 : 软件 很 多 时 候 是 给 人 看 的 ， 只 古 侦 尔 让 机 器 执行 。 


6.2.2 ”深入 探究 
继续 以 pprint 为 例 ， 深 入 人 研究 : 


>>> import pprint 
'_commajoi 


>>> dir(pprint) 
['PrettyPrinter', '_StringI0', '_ all ', '_ builtins ', '_doc ', '_file ', '_name _', '__package 
n', '_id', '_len', '_perfcheck', '_recursion', '_safe_repr', '_sorted', '_sys', '_type', 'isreadable', 'isrecursive', 
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pformat', 'pprint', 'saferepr', 'warnings'] 


对 dir0 并 不 卫生 。 从 结果 中 可 以 看 到 pprint 的 属性 和 方法 。 其 中 有 不 少 
征 以 双 画 线 、 单 画 线 开 头 的 。 但 为 了 不 影响 我 们 的 视觉 ， 先 把 它们 去 


拓 。 


>> [mfor m in dir(pprint) if not m.startswith('_') ] 
['PrettyPrinter', 'isreadable', 'isrecursive', 'pformat', 'pprint', 'saferepr', 'warnings'] 


针对 这 几 个 ， 为 了 能 够 搞 清 楚 它 们 的 含义 ， 可 以 使 用 helpO， 比 如 : 


>>> help(isreadable) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


NameError: name 'isreadable' is not defined 


这 样 做 是 错误 的 ， 知 道 错 在 何 处 吗 ? 


>>> help(pprint.isreadable) 


前 面 是 用 import pprint 方 式 引 入 模块 的 : 


Help on function isreadable in module pprint: 
isreadable(object) 


Determine if saferepr(object) is readable by eval(). 


通过 帮助 信息 ， 能 够 查看 到 该 方法 的 详细 说 明 。 可 以 用 这 种 方法 一 个 
一 个 地 查 过 来 ， 对 每 个 方法 都 熟悉 一 些 。 


注意 pprint.PrettyPrinter 是 一 个 类 ， 后 面 的 是 函数 (方法 ) 
再 回头 看 看 dir (pprint) 的 结果 : 


2 porints -all 


['pprint', 'pformat', 'isreadable', 'isrecursive', 'saferepr', 'PrettyPrinter'] 


Un 除了 "warnings"， 跟 前 面 通过 列表 解析 式 得 到 的 


其 实 ， 当 我 们 使 用 from pprint importx 的 时 候 ， 职 是 将 _all_ 里面 的 方 
法 引入 ， 如 果 没 有 这 个 ， 束 会 将 其 他 所 有 属性 、 方 法 等 引入 ， 包 括 那 
些 以 双 男 线 或 者 单 男 线 开 头 的 变量 、 函 数 ， 事 实 上 这 些 东 西 很 少 在 引 
入 模块 时 被 使 用 。 


6.2.3 帮助、 文档 和 源码 


你 能 记 住 每 个 模块 的 属性 和 方面 吗 ? 比如 前 面 刚刚 查询 过 的 pprint 模 块 
中 的 属性 和 方法 ， 现 在 能 背诵 出 来 吗 ? 我 的 记忆 力 不 行 ， 都 记 不 住 。 

所 以 ， 我 非常 喜欢 使 用 dir0 和 helpO0， 这 也 是 本 书 从 开始 到 现在 ， 乃 至 
到 以 后 ， 总 在 提倡 的 方式 。 


>>> print pprint._ doc 


Support to pretty-print lists, tuples, & dictionaries recursively. 
Very simple, but useful, especially in debugging data structures. 


Classes 


PrettyPrinter() 
Handle pretty-printing operations onto a stream using a configured 


set of formatting parameters. 


Functions 


pformat() 


Format a Python object into a pretty-printed representation. 


pprint() 


Pretty-print a Python object to a stream [default is sys.stdout]. 


saferepr() 
Generate a 'standard' repr()-like value, but protect against recursive 


data structures. 


ee 征 查 看 整个 类 的 文档 ， 还 知道 整个 文档 写 在 什么 地 方 
吗 ? 


还 是 使 用 pm.py 那 个 文件 ， 增 加 如 下 内 容 : 


#!/usr/bin/env python 


# coding=utf-8 


mm # 增 加 的 
This is a document of the python module. # 增 加 的 


mm # 增 加 的 


def lang(): 
# 省 略 了 ， 后 面 的 也 省 略 了 


在 这 个 文件 的 开始 部 分 ， 在 所 有 类 、 方 法 和 import 之 前 ， 写 一 个 用 三 
个 引号 包括 的 字符 囊 。 这 文 束 古 文档 。 


>>> import sys 


>>> sys.path.append("~/Documents/VBS/StarterLearningPython/2code") 


>>> import pm 


>>> print pm. doc 


This is a document of the python module. 


这 就 是 撰写 模块 文档 的 方法 ， 即 在 .py 文件 的 最 开始 写 相 应 的 内 容 ， 这 
个 要 求 应 该 成 为 开发 者 的 习惯 。 


对 于 Python 的 标准 库 和 第 三 方 模块 ， 不 仅 可 以 看 帮助 信息 和 文档 ， 
能 够 查看 源码 ， 因 为 它 是 开放 的 。 


还 是 回头 到 dir (pprint) 中 找 一 找 ， 有 一 个 _file _， 它 就 告诉 我 们 这 
个 模块 的 位 置 : 


>>> print pprint. file _ 


/usr/1lib/python2.7/pprint.pyc 


我 是 在 Ubuntu 中 操作 ， 读 者 要 注意 观察 目 己 的 操作 系统 结 


里 然 是 .pyc 文 件 ， 但 古 不 用 担心 ， 根 据 显 示 的 目录 ， 找 到 相应 的 .py 文 
件 即 可 。 


$ 1s /usr/lib/python2.7/pp* 


/usr/lib/python2.7/pprint.py /usr/lib/python2.7/pprint.pyc 


果然 有 一 个 pprint.py， 打 开 它 ， 就 看 到 源码 了 。 


$ cat /usr/lib/python2.7/pprint.py 


"""Support to pretty-print lists, tuples, & dictionaries recursively. 
Very simple, but useful, especially in debugging data structures. 


Classes 


PrettyPrinter() 
Handle pretty-printing operations onto a stream using a configured 


set of formatting parameters. 


Functions 


pformat() 


Format a Python object into a pretty-printed representation. 


0 文档 中 的 部 分 信息 ， 是 不 是 跟前 面 通过 doc” 查看 的 结果 
一 样 呢 ? 


请 读者 在 闲暇 时 间 阅 读 源码 。 事 实证 明 ， 这 种 标准 库 中 的 源码 是 质量 
最 好 的 。 阅 读 高 质量 的 代码 ， 征 提高 编程 水 平 的 途径 之 一 。 


6.3 ”标准 库 

Python 标准 库 的 内 容 非 常 多 ， 有 人 专门 为 此 写 过 一 本 书 。 在 本 书 中 ， 
我 将 根据 目 己 的 理解 和 喜好 ， 选 儿 个 呈现 出 来 ， 一 来 显示 标准 库 之 强 
大 功能 ， 二 来 演示 如 何 理解 和 使 用 标准 库 。 

6.3.1 sys 


这 是 一 个 跟 Python 解 释 侣 关系 密切 的 标准 库 ， 前 面 已 经 使 用 过 
sys.path.append() ° 


>>> import sys 


>>> print sys._doc_ _ 


显示 了 sys 的 基本 文档 ， 第 一 句 话 概括 了 本 模块 的 基本 特点 。 


This module provides access to some objects used or maintained by the 


interpreter and to functions that interact strongly with the interpreter. 


在 诸多 sys 函 数 和 变量 中 ， 选 择 常 用 的 来 说 明 。 
1.SyS.argV 


sys argv 是 变量 ， 专 门 用 来 向 python 解释 器 传递 参数 ， 所 以 名 日 “命令 
行 参数 "。 


先 解释 什么 是 命令 行 参数 。 


$ python --version 


Python 2.7.6 


这 里 的 --version 束 是 是 命令 行 参 数 ， 如 果 你 使 用 python--help 可 以 看 到 更 


多 : 


$ python --help 

usage: python [option] ... [-c cmd | -m mod | file | -] [arg] 

Options and arguments (and corresponding environment variables): 

-B : don't write .py[co] files on import; also PYTHONDONTWRITEBYTECODE=x 


-Cc cmd : program passed in as string (terminates option list) 


-d : debug output from parser; also PYTHONDEBUG=x 

-E : ignore PYTHON* environment variables (such as PYTHONPATH) 

-h : print this help message and exit (also --help) 

-i : inspect interactively after running script; forces a prompt even 


if stdin does not appear to be a terminal; also PYTHONINSPECT=X 


-m mod : run library module as a script (terminates option list) 


-0 : optimize generated bytecode slightly; also PYTHONOPTIMIZE=X 
-00 : remove doc-strings in addition to the -0 optimizations 
-R : Use a pseudo-random salt to make hash() values of various types be 


unpredictable between separate invocations of the interpreter, as 


a defense against denial-of-service attacks 


只 选择 了 部 分 内 容 摆 在 这 里 。 -h 之 流 ， 都 是 参数 ， 比 
如 python-h， 其 功能 同上 上， 那么 -h 也 是 命令 行 参数 。 


Sang 在 Python 中 的 作用 就 是 这 样 ， 通 过 通过 它 可 以 向 解释 器 传递 命令 行 
i 


#!/usr/bin/env python 


# coding=utf-8 
import sys 


print "The file name: ", sys.argv[0] 
print "The number of argument", len(sys.argv) 


print "The argument is: ", str(sys.argv) 


将 上 述 代 码 保存 ， 文 件 名 是 22101.py。 然 后 如 此 做 : 


$ python 22101.py 
The file name: 22101.py 
The number of argument 1 


The argument is: ['22101.py'] 


将 结果 和 前 面 的 代码 做 个 对 照 。 


(1 ) 在 $python 22101.py 中 ,，“22101.py” 是 要 运行 的 文件 名 ， 同 时 也 是 
命令 行 参 数 ， 是 前 面 的 Python 这 个 指令 的 参数 ， 其 地 位 与 python-h 中 的 
参数 -h 是 等 同 的 。 


(2) sys.argv[0] 是 第 一 个 参数 ， 就 是 上 面 提 到 的 22101.py， 即 文件 


[© 


如 果 这 样 来 试 试 : 


$ python 22101.py beginner master www.itdiffer.com 
The file name: 22101.py 
The number of argument 4 


The argument is: ['22101.py', 'beginner', 'master', 'www.itdiffer.com'] 


在 这 里 用 sys.arg[1] 得 到 的 就 是 beginner， 依 次 类 推 。 
2.sys.exit() 
Eg i 壕 退出 当前 程序 


Help on built-in function exit in module sys: 


exit(...) 


exit([status]) 


Exit the interpreter by raising SystemExit(status). 
If the status is omitted or None, it defaults to zero (i.e., success). 
If the status is an integer, it will be used as the system exit status. 


If it is another kind of object, it will be printed and the system 


exit status will be one (i.e., failure). 


从 文档 信息 中 可 知 ， 如 采用 sys.exit0 退 出 程序 ， 会 返回 SystemExit 异 
1 还 有 另外 一 种 j 退出 方式 ; © ee 这 两 个 有 
又 别 | 。 


#!/usr/bin/env python 


# coding=utf-8 
import sys 


for i in range(10): 


这 段 程序 的 运行 结 采 惑 是 : 
$ python 22102.py 


9 


公 


3 


在 有 的 函数 中 〈 甚 至 大 多 数 函 数 中 ) 会 用 到 retum， 其 含义 古 终止 当前 
的 函数 ， 并 返回 相应 值 (如 果 没 有 就 是 None) 。 但 是 sys.exitO 的 含义 
是 退出 当前 程序 ， 并 发 起 SystemExit 异 常 。 这 就 是 两 者 的 区 别 了。 


使 用 sys.exit (0) 表示 正常 退出 ， 如 果 退 出 的 时 候 有 一 个 对 人 友好 的 提 
可 以 用 sys.exit ("I wet out at here.") ， 那 么 字符 串 信 息 就 被 
本 印 出 来 。 


3.sys.path 


sys.path 已 经 不 卫生 了 ， 它 可 以 查找 模块 所 在 的 目 隶 ， 以 列表 的 形式 显 
2 ° 如 采用 append() 方 法 ， 束 能 够 同 这 个 列表 增加 新 的 模块 目 


4.sys.stdin, sys.stdout, sys.stderr 


将 这 三 个 放 到 一 起 ， 是 因为 他 们 的 变量 都 是 类 文件 流 对 象 ， 分 别 表示 
标准 UNIX 概 念 中 的 标准 输入 、 标 准 输出 和 标准 错误 。 与 Python 功能 对 
照 ，sys.stdin 获 得 输入 〈 用 raw_inputO 输 入 的 通过 它 获 得 ，Python 3.x 中 
是 imputO0) ，sys.stdout 负 责 输 出 。 


流 是 程序 输入 或 输出 的 一 个 连续 的 字 节 序列 ， 设 备 (例如 鼠标 、 键 

` 磁盘 、 屏 幕 、 调 制 解 调 器 和 打印 机 ) 的 输入 和 输出 都 是 用 流 来 处 

理 的 。 程 序 在 任何 时 候 都 可 以 使 用 它们 。 一 般 来 讲 ，stdin (输入 ) 并 

不 一 定 来 目 键盘 ，stdout (输出 ) 也 并 不 一 定 显示 在 屏幕 上 ， 它 们 都 可 
以 重 定 同 到 位 组 文 件 或 其 他 设备 上 。 


还 记得 print0 吧 ， 它 的 本 质 就 是 sys.stdout.write (objectt+"\n') 。 


Sys.stdout.write(object + '\n')° 


>>> for i in range(3): 


a p t 
9 
1 
2 
port sy 


>>> for i in range(3): 


0 


>>> for i in range(3): 


Sys.stdout.write(str(i) + '\n') 


0 
和 


2 


从 这 里 可 以 看 出 ， 两 者 是 完全 等 效 的 。 如 果 仅 仅 止 于 此 ， 则 意义 不 
大 。 更 强大 的 在 于 通过 sys.stdout 能 够 做 到 将 输出 内 容 从 “控制 台 ” 转 
到 “文件 "， 称 之 为 重 定向 。 这 样 也 许 控制 台 看 不 到 (很 多 时 候 这 个 不 
重要 ) ， 但 是 文件 中 已 经 有 了 要 输出 的 内 容 。 


>>> f = open("stdout.md", "w") 


>>> sys.stdout = f 
>>> print "Learn Python: From Beginner to Master" 


>>> f.close() 


当 sys.stdout=f 之 后 ， 就 意味 着 将 输出 目的 地 转 到 了 打开 (建立 ) 的 文 
0 
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打开 文件 看 看 便 知 : 


$ cat stdout.md 


Learn Python: From Beginner to Master 


这 就 是 标准 输出 。 
男 外 两 个 ， 输 入 和 错误 也 类 似 ， 读 者 可 以 目 行 测试 。 
6.3.2 copy 


前 面 对 浅 拷贝 和 深 找 贝 做 了 研究， 这 里 再 次 提出 ， 即 是 
数 ， 以 显得 我 考虑 到 了 这 个 常用 模块 。 


>>> import copy 


>>> copy. all 


['Error', 'copy', 'deepcopy'] 


这 个 模块 中 常用 的 就 是 copy 和 deepcopy。 
为 了 具体 说 明 ， 看 这 样 一 个 例子 : 


#!/usr/bin/env python 


# coding=utf-8 
import copy 
class MyCopy(object ) : 
def _ init_ (selLlf，Vvalue) : 


self.value = Value 


def _ repr_ (self): 


return str(self.value) 
foo = MyCopy(7) 
a= ["foo"; foo] 
b= al:] 
c= list(a) 
d = copy.copy(a) 


e = copy.deepcopy(a) 


a.append("abc") 


foo.value = 17 


print "original: %r\n slice: %r\n list(): %r\n copy(): %r\n deepcopy(): %r\n" % (a,b,c,d,e) 


保存 并 运行 : 


汶 


$ python 22103.py 


original: ['foo', 17, 'abc'] 


slice: ['foo', 17] 


list(): ['foo', 17] 


copy(): ['foo', 17] 


['foo', 7] 


deepcopy(): 
昭 结 


读者 可 以 对 照 结 
一 深 拷贝 和 浅 拷贝 。 


6.3.3 os 


果 和 程序 ， 丈 能 理解 各 种 拷贝 的 实现 方法 和 含义 了 


os 模块 提供 了 访问 操作 系统 服务 的 功能 合 的 内 容 比 较 多 


时 候 感觉 很 神秘 


>>> import os 


TN 


>>> dir(os) 


'EX_NOPERM', 'EX_NOUSER' 


'EX_OK'， 


， 有 


['EX_CANTCREAT', 
EX_OSERR', 
X', '0_APPEND', 
ATIME', 'O_NOCTTY', ' 
OWAIT', 'P_NOWAITO', 

ST_NODEV', 
AX', 'UserDict', 
WNOHANG', 'WSTOPSIG', 
le _', '_name _', ' 


'EX_CONFIG'， 
'EX_OSFILE', 
'0_ASYNC', 


'ST_NODIRATIME', 
'WCONTINUED', 


'EX_DATAERR', 'EX_IOERR', 'EX_NOHOST', 'EX_NOINPUT', 
'EX_PROTOCOL', 'EX_SOFTWARE', 'EX_TEMPFAIL', 'EX_UNAVAILABLE', 'EX_USAGE', 'F_OK', 'NGROUPS_ MA 
'O_CREAT', 'O0_DIRECT', '0_DIRECTORY '， '0_DSYNC'， '0_EXCL'， '0_LARGEFILE', '0_NDELAY', '0_NO 
'O_NONBLOCK', '0_RDONLY', '0_RDWR'， '0_RSYNC'， '0_SYNC', 'O_TRUNC', 'O_WRONLY', 'P_N 
'SEEK_CUR', 'SEEK_END', 'SEEK_SET', 'ST_APPEND', 'ST_MANDLOCK', 'ST_NOATIME', ' 
'ST_NOEXEC', 'ST_NOSUID', 'ST_RDONLY', 'ST_RELATIME', 'ST_SYNCHRONOUS', 'ST_WRITE', 'TMP_M 
'WCOREDUMP', 'WEXITSTATUS', 'WIFCONTINUED', 'WIFEXITED', 'WIFSIGNALED', 'WIFSTOPPED', ' 
'WTERMSIG', 'WUNTRACED', 'W_OK', 'X_OK', '_Environ', '_ all ', ' builtins ', '_ doc ', '_ fi 
package ', '_copy_reg', '_execvpe', '_exists', ' exit', '_get exports list', '_make_ stat_result 


0_NOFOLLOW'， 
'P_WAIT', 'R_OK', 


， '_make_statvfs_result', 
'chown', 


'chdir', "chmod '， 
/ 'devnull', 
xecvp', 'execvpe' 
Mt "Totatyvte 
tloadavg', 'getlogin' 
roups', 'isatty', 
edirs', 'minor', 
f_names', 'pathsep' 
s', 'rename', 
/ 'Setresgid', 
wnve', 'spawnvp', 
了 TV 

"ttyname '， 'umask', 


‘dup',! 


"extsep' 
《SSVRG 


本 
"mkdir' 


"renames ' ， 
"Setresuid ' ， 
"Spawnvpe '， 
"SySconf '， 


'_pickle stat_result', '_pickle_ statvfs_result', '_spawnvef', 'abort', 'access', 'altsep', 
"chroot '， 'close', 'closerange', 'confstr', 'confstr_names', 'ctermid', 'curdir', 'defpath' 
'environ', 'errno', 'error', 'execl', 'execle', 'execlp', 'execlpe', 'execv', 'execve', 'e 
"fchdir'， 'fchmod', 'fchown', 'fdatasync', 'fdopen', 'fork', 'forkpty', 'fpathconf', 'fst 
'ftruncate', 'getcwd', 'getcwdu', 'getegid', 'getenv', 'geteuid', 'getgid', 'getgroups', 'ge 
'getpgrp', 'getpid', 'getppid', 'getresgid', 'getresuid', 'getsid', 'getuid', 'initg 
'killpg', 'lchown', 'linesep', 'link', 'listdir', 'lseek', 'lstat', 'major', 'makedev', 'mak 
‘mkfifo', 'mknod', 'name', "nice'， 'open', 'openpty', 'pardir', 'path', 'pathconf', 'pathcon 
'pipe', "popen'， 'popen2', 'popen3', 'popen4', 'putenv', 'read', 'readlink', 'remove', 'removedir 
'rmdir', 'sep', 'setegid', 'seteuid', 'setgid', 'setgroups', 'setpgid', 'setpgrp', 'setregid' 
'setreuid', 'setsid', 'setuid', 'spawnl', 'spawnle', 'spawnlp', 'spawnlpe', 'spawnv', 'spa 
'stat', 'stat float times', 'stat result', 'statvfs', 'statvfs_ result', 'strerror', 'sym 
'sysconf_names', 'system', 'tcgetpgrp', 'tcsetpgrp', 'tempnam', 'times', 'tmpfile', 'tmpnam’', 
'unlink', 'unsetenv', 'urandom', 'utime', 'wait', 'wait3', 'wait4', 'waitpid', 'walk', ' 


dup2";, 


, "getpgid '， 


"uname '， 


write'] 


和信 将 


对 


小 专 \\ 


这 么 多 内 容 不 能 都 介绍 ， 列 出 来 纯粹 是 要 吓 距 你 一 下 ， 移 混 个 脸 


将 来 用 到 哪个 了 ， 可 以 到 这 里 来 找 


? 


下 面 介绍 的 都 是 我 自 认 为 用 得 比较 多 的 ， 天 不信 和 全 用 7A 同 


性 ， 但 是 
另外 一 个 好 工具 
歌 ) 


1. 操 作文 件 ， 重 命名 、 删 除 文件 


在 对 文件 进行 操作 的 时 候 ，openO 这 个 内 建 函 才 
件 。 但 是 ， 如 有 果 对 文件 进行 改名 、 删 除 操作 ， 


征 这 里 没有 介绍 ， 你 完全 可 以 目 己 用 help0 来 目 学 ， 当 然 ， 
一 一 Google (内 事 不 决 问 Google， 外 事 不 明 问 合 


Ld 


可 以 建立 、 打 开 文 


还 有 有 


束 要 使 用 os 模块 的 方法 


了 o 
首先 建立 一 个 文件 ， 文 件 名 为 22201.py， 文 件 内 容 是 


#!/usr/bin/env python 


# coding=utf-8 
print "This is a tmp file." 


然后 将 这 个 文件 名 称 修改 为 别 的 名 称 。 


>>> import os 


> os.rename("22201.py", "newtemp.py") 


， 我 是 先进 入 到 了 文件 22201.py 的 目录 ， 然 后 再 进入 交互 模式 ， 
可 以 直接 写 文件 名 ， 如 果 不 是 这 样 ， 需要 将 文件 的 路 径 写 上 。 


os.rename ("22201.py"，"newtemp.py") 中 ， 第 一 个 文件 是 原文 件 名 
称 ， 第 二 个 是 打算 修改 成 为 的 文件 名 。 


然后 查看 ， 能 够 看 到 这 个 文件 。 


$ ls new* 


newtemp.py 


文件 内 容 可 以 用 cat newtemp.py 本 看 (这 起 在 Ubuntu 系 统 ， 如 果 是 
Windows 系 统 ， 可 以 用 其 相应 的 编辑 器 打开 文件 看 内 容 ) 。 


除了 修改 文件 名 称 ， 还 可 以 修改 目录 名 称 ， 请 注意 阅读 帮助 信息 。 


rename(...) 
rename(old, new) 


Rename a file or directory. 


男 外 一 个 os.remove()， 首 先 看 帮助 信息 ， 然 后 再 实验 。 


remove(...) 
remove(path) 


Remove a file (same as unlink(path) ) . 


为 了 测试 ， 先 建立 一 些 文件 。 


$ pwd 


/home/qw/Documents/VBS/StarterLearningPython/2code/rd 


这 十 我 建立 的 临时 目录 ， 里 面 有 几 个 文件 : 


$ 1s 


a.py b.py c.py 


下 面 删 除 a.py 文 件 。 


>>> import os 


>>> os.remove("/home/qw/Documents/VBS/StarterLearningPython/2code/rd/a.py") 


看 看 删 了 吗 ? 


$ 1s 


b.py c.py 


ar 
林 然 管用 ， 再 来 一 个 狠 的 : 
1 》 
>>> os.remove("/home/qw/Documents/VBS/StarterLearningPython/2code/rd") 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


OSError: [Errno 21] Is a directory: '/home/qw/Documents/VBS/StarterLearningPython/ 2codevrd ' 


报错 了 。 我 打算 将 这 个 目录 下 的 所 简 文 件 删 光 ， 但 这 么 做 不 行 。 注 意 
帮助 中 的 那 句 Remove a file，os.remove() 束 是 用 来 删除 文件 的 。 并 且 从 
报错 中 也 可 以 看 到 ， 错 误 的 原因 在 于 那个 参数 是 一 个 目录 。 

要 删除 目录 ， 还 得 继续 同 下 学 习 。 

2. 操 作 目 录 


(1) os.listdir 显示 目录 中 的 文件 。 


Help on built-in function listdir in module posix: 


listdir(...) 


listdir(path) -> list_of_strings 
Return a list containing the names of the entries in the directory. 
path: path of directory to list 


The list is in arbitrary order. It does not include the special 


entries '.' and '..' even if they are present in the directory. 


看 完 帮 助 信息 ， 读 者 一 定 觉 得 这 是 一 个 非常 简单 的 方法 ， 不 过 ， 要 特 
别 注 意 它 返 人 日 不 显示 文件 夹 中 用 特殊 格式 命名 的 文件 
它们 是 隐藏 文件 ) 。 在 Linux 中 ， 用 1s 命 令 也 看 不 到 这 些 隐藏 的 文 


>>> os.listdir("/home/qw/Documents/VBS/StarterLearningPpython/2code/rd") 


['b.py', 'c.py'] 
>>> files = os.listdir("/home/qw/Documents/VBS/StarterLearningPython/2code/rd") 
>>> for f in files: 


print f 


b.py 


c.py 


(2) os.getcwd，os.chdir 当前 工作 目录 ， 改 变 当 前 工作 目录 。 


这 两 个 芳 数 怎么 用 ? 唯 有 通过 help() 看 文档 了 ， 请 读者 目 行 看 看 ， 环 不 
贴 出 来 了 ， 仅 演示 一 个 例子 : 


>>> cwd = os.getcwd() # 当 前 目录 


>>> print cwd 


/home/qw/Documents/VBS/StarterLearningPython/2code/rd 


>>> os.chdir(os.pardir) # 进 入 到 上 一 级 
>>> os.getcwd() # 当 前 


'/home/qw/Documents/VBS/StarterLearningPython/2code' 


>>> os.chdir("rd") # 进 入 下 级 


>>> os.getcwd() 


'/home/qw/Documents/VBS/StarterLearningPython/2code/rd' 


-> 
-> 


os.pardir 的 功能 是 获得 父 级 目录 ， 相 当 于 “.. 


>>> os.pardir 


(3) os.makedirs，os.removedirs: 创建 和 删除 目录 。 
直接 上 例子 : 


>>> dir = os.getcwd() 
Sh dr 
'/home/qw/Documents/VBS/StarterLearningPython/2code/rd' 
>>> os.removedirs(dir) 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

File "/usr/lib/python2.7/0s.py", line 170, in removedirs 

rmdir(name) 

OSError: [Errno 39] Directory not empty: 


'/home/qw/Documents/VBS/StarterLearningPython/2code/rd' 


什么 时 候 都 不 能 得 意 忘 形 ， 一 定 要 谦 举 ， 从 看 文档 开始 一 点 一 点 地 理 
解 。 者 报错 信息 ， 要 出 除 某 个 外 录 ， 则 部 个 目录 必须 是 空间 。 


>>> os.getcwd() 


'/home/qw/Documents/VBS/StarterLearningPython/2code' 


这 是 当前 目录 ， 在 这 个 目录 下 再建 一 个 新 的 子 目 录 : 


>>> os.makedirs("newrd") 
>>> os.chdir("newrd") 
>>> os.getcwd() 


'/home/qw/Documents/VBS/StarterLearningPython/2code/newrd'"' 


建立 了 一 个 。 下 面 把 刚刚 建立 的 这 个 目 孙 删除 ， 受 无 疑问 它 征 空 的 。 


>>> os.listdir(os.getcwd()) 
[] 
>>> newdir = os.getcwd() 


>>> os.removedirs(newdir) 


按照 我 的 理解 ， 这 里 应 该 报错 。 因 为 我 是 在 当前 工作 目录 删除 当前 工 
作 上 日 录 ， 如 果 这 样 能 够 执行 ， 总 觉得 有 点 别扭 。 但 事实 上 行 得 通 ， 就 
算是 Python 的 规定 吧 9 不 过 ， 若 让 我 来 确定 这 个 功 公 的 话 ， 还 是 习惯 
不 能 在 本 地 删除 本 地 。 


按照 上 面 的 操作 ， 再 看 当前 的 工作 目录 : 


>>> os.getcwd() 


Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 


OSError: [Errno 2] No such file or directory 


目 孙 被 王 了 ， 只 能 回 到 父 级 。 


>>> os.chdir(os.pardir) 
>>> os.getcwd() 


'/home/qw/Documents/VBS/StarterLearningPython/2code' 


有 点 不 可 思议 ， 本 来 没有 当前 工作 目录 ， 怎 么 会 有 “ 父 级 ” 呢 ? 但 现实 
~ TY 日 YY >» 
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补充 一 点 ， 前 面 说 的 如 果 目 录 不 空 ， 束 不 能 用 os.removedirs() 删 除 。 但 
是 ， 可 以 用 模块 shutil 的 retree 方 法 。 


>>> os.getcwd() 


'/home/qw/Documents/VBS/StarterLearningPython/2code' 
>>> os.chdir("rd") 

>>> now = os.getcwd() 

>>> now 
'/home/qw/Documents/VBS/StarterLearningPython/2code/rd' 
>>> os.listdir(now) 

['b.py', 'c.py'] 

>>> import shutil 

>>> Shutil.rmtree(now) 

>>> os.getcwd() 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 


OSError: [Errno 2] No such file or directory 


请 读者 注意 ， 对 于 os.makedirs() 还 有 这 样 的 特点 : 


>>> os.getcwd() 
'/home/qw/Documents/VBS/StarterLearningPython/2code' 
>>> d0 = os.getcwd() 


>>> di 


do+"/ndir1i/ndir2/ndir3" # 这 是 想 建立 的 目录 ， 但 是 ndir1, ndir2 也 都 不 存在 。 
> 
'/home/qw/Documents/VBS/StarterLearningPython/2code/ndir1i/ndir2/ndir3"' 

>>> os.makedirs(d1) 

>>> os.chdir(d1) 

>>> os.getcwd() 


'/home/qw/Documents/VBS/StarterLearningPython/2code/ndir1i/ndir2/ndir3"' 


不 存在 的 目录 也 被 建立 起 来 ， 直 到 做 右边 的 目录 为 止 。 与 os.makedirs() 
类 似 的 还 有 os.mkdir()， 不 过 ，os.mkdir() 没 有 上 面 这 个 功能 ， 它 只 能 一 
层 一 层 地 建 日 隶 。os.removedirs() 和 os.rmdir() 也 类 似 ， 区 别 也 类 似 上 
面 o 


3. 文 件 和 目录 属性 


不 管 是 哪 种 操作 系统 ， 都 能 看 到 文件 或 者 目录 的 有 关 属 性 ， 那 么 ,在 
os 模块 中 ， 也 有 这 样 的 一 个 方法 : os.stat0。 


>>> p = os.getcwd() # 当 前 目录 


>>> p 


'/home/qw/Documents/VBS/StarterLearningPython' 


显示 这 个 目录 的 有 关 信 息 : 


>>> os.stat(p) 


posix.stat_result(st_mode=16895, st_ino=4L, st_dev=26L, st_nlink=1, st_uid=0, st_gid=0, st_size=12288L, st_atime=14302 
24935, st_mtime=1430224935, st_ctime=1430224935) 


再 指定 一 个 文件 : 


>>> pf = p + "/README.md" 


显示 此 文件 的 信息 .: 


>>> os.stat(pf) 


posix.stat_result(st_mode=33279, st_ino=67L, st_dev=26L, st_nlink=1, st_uid=0, st_gid=0, st_size=50L, st_atime=1429580 
969, st_mtime=1429580969, st_ctime=1429580969) 


从 结果 中 看 ， 可 能 看 不 出 什么 来 ， 先 不 用 着 急 。 这 样 的 结果 对 
computer 寻 女 是 友好 的 ， 但 可 能 对 读者 不 友好 。 如 采用 下 面 的 方法 ， 
号 友好 多 了 : 


2 它 代 表 最 后 modified (修改 ) 文件 的 时 间 。 看 
结果 : 


>> mt 


1429580969 


还 是 不 友好 ， 下 面 用 time 模 块 来 友好 一 下 : 


>>> import time 
>>> time.ctime(mt) 


现在 殴 对 读者 友好 了 。 


用 os.stat() 能 够 查看 文件 或 者 目 孙 的 属性 。 如 采 要 修改 呢 ? 比如 在 部 署 
网 站 的 时 候 ， 常 淄 要 修改 目录 或 者 文件 的 权限 等 。 这 种 操作 在 Python 
的 os 模块 能 做 到 吗 ? 


要 求 越 来 越 多 了 。 一 般 情 况 下 ， 不 在 Python 里 做 这 个 ， 当 然 ， 世 界 十 
复杂 的 ， 肯 定 有 人 会 用 到 的 ， 所 以 os 模块 提供 了 os.chmod0) 


4. 操 作 命 令 


读者 如 果 使 用 某 种 Linux 系 统 ， 或 者 曾经 用 过 DOS ( 奴 怕 很 少 ;  ， 或 者 
在 Windows 里 面 用 过 command， 对 敲 命 令 都 不 防 生 。 通 过 命令 来 做 事 
情 的 确 是 很 酷 的 ， 比 如 ， 我 在 Ubuntu 中 ， 要 查看 文件 和 目录 ， 只 需要 
ls 就 足够 了 。 我 并 不 是 否认 图 形 界面 ， 对 于 某 些 人 (比如 程序 员 ) 在 
某 些 情况 下 ， 命 令 是 不 错 的 选项 ， 甚 至 是 离 不 开 的 。 


os 模块 中 提供 了 这 样 的 方法 ， 许 可 程序 员 在 Python 程序 中 使 用 操作 系 
统 的 命令 。 《以 下 是 在 Ubuntu 系统 ， 如 果 读 者 是 Windows 系 统 ， 可 以 
将 命令 换 成 DOS 命 令 。) 


>>> p 

'/home/qw/Documents/VBS/StarterLearningPython' 
mmand = "ls " +p 

>>> comman d 

"1Ls /home/qw/Documents/VBS/StarterLearningPython'"' 


为 了 输入 方便 ， 采用 了 前 面 例子 中 已 经 有 的 那个 日 隶 ， 并 且 ， 用 拼接 
字符 串 的 方式 ， 将 要 输入 的 命令 (查看 某 文件 夹 下 的 内 容 ) 组 装 成 一 
个 字符 串 ， 赋 值 给 变量 command， 然 后 : 


>>> os.system(command) 

91.md 101.md 105.md 109.md 113.md 117.md 121.md 125.md 129.md 201.md 205.md 209.md 213.md 217.md 221. 
md index.md 

02.md 102.md 106.md 110.md 114.md 118.md 122.md 126.md 130.md 202.md 206.md 210.md 214.md 218.md 222. 
md ng991.md 


93 .md 103.md 107.md 111.md 115.md 119.md 123.md 127.md 1code 203.md 297.md 211.md 215.md 219.md 2cod 


README .md 


Qimages 104.md 108.md 112.md 116.md 120.md 124.md 128.md 1images 204.md 208.md 212.md 216.md 220.md 2ima 
ges 
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这 样 束 列 出 来 了 该 目录 下 的 所 有 内 容 。 


需要 注意 的 是 ，os.system0 是 在 当前 进程 中 执行 命令 ， 直 到 它 执 行 结 
束 。 如 果 需 要 一 个 新 的 进程 ， 可 以 使 用 os.exec 或 者 os.execvp。 对 此 有 
兴趣 详细 了 解 的 读者 ， 可 以 查看 帮助 文档 了 解 。 男 外 ，os.system() 通 
过 shell 执 行 命令 ， 执 行 结束 后 将 控制 权 返 回 到 原来 的 进程 ， 但 是 
os.exec0O 及 相关 的 函数 ， 则 在 执行 后 不 将 控制 权 返 回 到 原 继承 ， 从 而 
使 Python 失去 控制 。 


关于 Python 对 进程 的 管理 ， 此 处 暂 不 介绍 。 
os.system() 是 一 个 用 途 很 多 的 函数 。 曾 有 一 个 朋友 网 上 询问 ， 用 它 来 


局 动 浏览 锅 。 不 过 ， 这 个 操作 的 确 要 非常 仔细 ， 为 什么 呢 ? 演示 一 下 
就 明日 了 。 


>>> os.system("/usr/bin/firefox") 


(process:4002): GLib-CRITICAL **: g_slice set config: assertion 'SyS_page_Ssize == 0' failed 


(firefox:4002): GLib-Gobject-WARNING **: Attempt to add property GnomeProgram:: sm-connect after class was initialised 


我 是 在 Ubuntu 上 操作 的 ， 浏 览 器 的 地 址 是 /usvbin/firefox， 可 是 ， 知 朋 
友 是 Windows 系 统 ， 那 么 加 要 非常 小 心 了 ， 因 为 在 Windows 里 面 ， 表 

示 路 径 的 和 斜 杠 跟 上 面 显 示 的 是 反 着 的 ， 可 是 在 Python 中 沪 " 代 表 转 义 。 
比较 简单 的 一 个 方法 是 用 r"c:\userMtfirfox.exe" 的 样式 ， 因 为 在 r" 中 的 ， 

都 被 认为 是 原始 字符 。 而 且 在 Windows 系 统 中 ， 一 般 情 况 下 那个 文件 
不 是 安装 在 我 演示 的 那个 从 单 样式 的 文件 夹 中 ， 而 是 安装 

在 “C:\Program Files”， 这 中 间 有 空格 ， 所 以 还 要 注意 空格 问题 。 读 者 
按照 这 些 提示 ， 看 看 能 不 能 完成 用 os.system0 局 动 firefox 的 操作 。 


凡是 感觉 肪 烦 的 东西 ， 必 然 有 另外 简单 的 方法 来 蔡 代 。 于 是 又 有 了 一 
个 webbrowser 模 块 ， 可 以 专门 用 来 打开 指定 网 页 。 


>>> import webbrowser 


>>> webbrowser .open("http://www.itdiffer.com") 


不 管 是 什么 操作 系统 ， 只 要 如 上 操作 束 能 打开 网 页 。 


真是 神奇 的 标准 库 ， 有 如 此 多 的 工具 ， 能 不 加 速 开发 进程 吗 ? 能 不 降 
低 开 发 成 本 吗 ? “人 生 苦 短 ， 我 用 Python | 


6.3.4 heapq 
堆 (heap) ， 是 一 种 数据 结构 ， 引 用 维基 百科 中 的 说 明 ; 


堆 (英语 ，heap) ， 是 计算 机 科学 中 一 类 特殊 的 数据 结构 的 统称 。 堆 
通 肖 是 一 个 可 以 被 看 作 一 棵 树 的 数组 对 象 。 


对 于 这 个 新 的 概念 ， 读 者 不 要 心 慨 意 乱 或 者 仆 惧 ， 因 为 它 本 质 上 不 是 
新 东西 ， 而 是 在 我 们 已 经 熟知 的 知识 基础 上 扩展 出 来 的 内 容 。 


堆 的 实现 是 通过 构造 二 又 堆 ， 也 就 是 一 种 二 又 树 。 
1. 基 本 知识 


这 是 一 颖 在 苏州 很 常见 的 香 榜 树 ， 马 路 两 边 、 公 园 里 随处 可 见 ， 特 别 
苹 在 艳阳 高 照 的 时 候 ， 它 的 树 随 能 把 路 面 扩 盖 。 


但 是 ， 在 编程 中 ， 我 们 第 说 的 树 是 这 样 的 : 


这 征 一 柠 “ 根 ?在 上 面 的 树 ， 也 十 编程 中 党 说 的 树 。 为 什么 会 这 样 呢 ? 
我 想 主要 是 画 着 更 方便 吧 。 上 面 那 村 树 虽然 根 在 上 面 了 ， 还 完全 是 写 
实 的 作品 ， 但 本 人 作为 一 名 隐姓埋名 多 年 的 抽象 派 画家 ， 不 喜欢 这 样 
的 树 ， 我 画 出 来 是 这 样 的 : 


可 不 要 小 看 这 两 根 枝 权 ，《 道 德 经 》 上 说 一生 

生 万 物 ”。 一 束 是 下 面 那 个 树干 ， 二 就 古 两 个 校 权 ， 每 
不 技术 还 襄 以 闭 作 个 一人。 然后 表现 个 术科 如 此 不 断 重复 (这 
简直 就 是 递归 呀 ) ， 就 成 为 了 一 棵 大 树 。 


这 棵 树 画 成 这 样 束 更 符合 编程 的 习惯 了 ， 可 以 同 下 不 断 延 伸 。 


并 且 给 它 一 个 正规 的 名 字 : 二 又 树 。 


这 个 也 是 二 又 树 ， 完 全 脱胎 于 我 所 画 的 后 现代 抽象 主义 作品 ， 但 也 略 
有 不 同 ， 这 幅 图 在 各 个 校 权 上 显示 的 是 数字 。 这 种 类 型 的 “ 树 ” 束 古 编 
程 语言 中 所 说 的 二 又 树 ， 维 基 百 科 日 : 


在 计算 机 科学 中 ， 二 又 树 (英语 : Binary tree) 是 每 个 节点 最 多 有 两 个 
子 树 的 树 结 构 。 通 常 子 树 被 称 作 “ 左 子 树 ” (left subtree) 和 “ 右 子 
树 ” (right subtree) 。 二 又 树 常 被 用 于 实现 二 又 查找 树 和 二 又 堆 。 


在 上 图 的 二 又 树 中 ， 最 顶端 的 那个 数字 相当 于 树 根 ， 也 称 作 “ 根 ”。 
个 数字 所 在 位 置 成 为 一 个 节点 ， 每 个 节点 同 下 分 散 出 两 个 “ 子 季 点 ”。 
并 不 是 所 有 下 点 都 有 两 个 子 和 点， 比如 上 图 的 最 后 一 层 ， 这 类 二 又 树 
又 称 为 完全 二 又 树 (Complete Binary Tree) ， 有 的 二 又 树 ， 所 有 的 节 
点 都 有 两 个 子 忆 点 ， 这 类 二 又 树 称 作 满 二 又 树 (Full Binarry Tree) ， 


如 下 图 。 


下 面 讨论 的 对 象 是 通过 二 又 树 实现 的 ， 其 具有 如 下 特点 : 


节点 的 值 大 于 等 于 《或 者 小 于 等 于 ) 任何 子 节 点 的 值 。 

斑点 左 子 树 和 右 子 树 是 一 个 二 又 堆 。 如 采 父 忆 点 的 值 总 大 于 等 于 
任何 一 个 子 节 点 的 值 ， 其 为 最 大 堆 ;， 知 父 世 点 的 值 总 小 于 等 于 子 
则 为 最 小 堆 。 上 面 图 示 中 的 完全 二 叉 树 ， 束 表示 一 个 最 


扒 的 类 型 还 有 别 的 ， 如 裴 流 那 由 堆 等 ， 但 很 少 用 。 所 以 ， 通 稼 将 二 又 
ee 。 下面 所 说 的 堆 台 是 二 叉 堆 ， 而 二 又 扒 又 是 用 二 又 树 实现 


2. 堆 的 存储 
堆 用 列表 来 表示 ， 如 图 6-1 所 示 。 


(1 WE 
~ 7 | 
@ BH © 
(a) 有 逻辑 结构 (b) 存 储 结 构 


图 6-1 用 列表 来 表示 堆 


从 图 示 中 可 以 看 出 ， 将 逻辑 结构 中 的 树 的 节点 数 子 依次 填 入 到 存储 结 
构 中 。 看 这 个 图 ， 似 乎 是 列表 中 按照 顺序 进行 排列 似 的 。 但 是 ， 这 仅 
仅 和 是 由 于 那个 树 的 特点 造成 的 ， 如 果 是 下 面 的 树 : 


A 


将 上 面 的 逻辑 结构 转换 为 存储 结构 ， 读 者 吕 能 看 出 来 了 ， 不 再 是 按照 
顺序 排列 的 了 。 


关于 堆 的 各 种 操作 ， 如 播 入 、 删 除 、 排 序 等 ， 本 节 不 会 专门 叙述 ， 读 
。 下面 要 介绍 如 何 用 Python 中 的 模块 heapq 来 实现 
这 些 操 作 。 


3.heapq 模 块 
heapq 中 的 heap 是 堆 ，gq 就 是 queue (队列 ) 的 缩写 。 此 模块 包括 : 


>>> import heapq 
>>> heapq._ all _ 


['heappush', 'heappop', 'heapify', 'heapreplace', 'merge', 'nlargest', 'nsmallest', 'heappushpop'] 


依次 查看 这 些 函 数 的 使 用 方法 。 
。 heappush (heap，x) : 将 x 压 入 堆 heap (这 是 一 个 列表 ) 。 


Help on built-in function heappush in module _heapq: 


heappush(...) 


heappush(heap, item) -> None. Push item onto heap, maintaining the heap invariant. 


>>> import heapq 

>>> heap = [] 

>>> heapq.heappush(heap, 3) 
>>> heapq.heappush(heap, 9) 
>>> heapq.heappush(heap, 2) 
>>> heapq.heappush(heap, 4) 
>>> heapq.heappush(heap, 0) 
>>> heapq.heappush(heap, 8) 
>>> heap 


[9, 2, 3, 9, 4, 8] 


请 读者 注意 上 面 的 操作 ， 在 向 堆 增 加 数值 的 时 候 并 没有 严格 按照 什么 
顺序 ， 是 随意 的 。 但 是 ， 当 查看 堆 的 数据 时 ， 显 示 的 是 一 个 有 一 定 顺 
序 的 数据 结构 。 这 种 顺序 不 是 按照 从 小 到 大 ， 而 是 按照 前 面 所 说 的 完 
全 二 义 树 的 方式 排列 ， 显 示 的 是 存储 结构 ， 可 以 把 它 还 原 为 逻辑 结 
构 ， 看 看 是 不 是 一 棵 二 又 树 。 


2) (3 
9 @ @ 


由 此 可 知 ， 利 用 heappush() 函 数 将 数据 放 到 堆 里 面 之 后 ， 会 目 动 按照 二 
又 树 的 结构 进行 存储 。 


。 heappop (heap) : 删除 最 小 元 素 。 
承接 上 面 的 操作 : 


>>> heapdq.heappop(heap) 
0 

>>> heap 
[有 


用 heappopO 函 数 ， 从 heap 堆 中 删除 了 一 个 最 小 元 素 ， 并 且 返 回 该 值 。 
但 是 ， 这 时 候 的 heap 显 示 顺 序 ， 并 非 简 单 地 将 0 去 除 ， 而 是 按照 完全 二 
又 树 的 规范 重新 进行 排列 。 


。 heapify(): 将 列表 转换 为 堆 。 
如 果 已 经 建立 了 一 个 列表 ， 利 用 heapifyO 可 以 将 列表 直接 转化 为 堆 。 


>>> hl = [2, 4, 6, 8, 9, 09, 1, 5, 3] 
>>> heapq.heapify(h1) 
>>> hl 


[0, 3, 1, 4, 9, 6, 2, 5, 8] 


经 过 这 样 的 操作 ， 列 表 hl 就 变 成 了 堆 〈 扒 的 顺序 和 列表 不 同 ) ， 可 以 
对 hl ( 堆 ) 使 用 heappop0 或 者 heappushO 等 函数 了 。 和 否则 ， 不 可 。 


>>> heapq.heappop(h1) 
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>>> heapq.heappop(h1) 


>>> hl 

[2, 3, 5, 4, 9, 6, 8] 
>>> heapq.heappush(hl, 9) 
>>> hl 


[2, 3, 5, 4, 9, 6, 8, 9] 


不 要 认为 堆 里 面 只 能 放 数 字 ， 举 例 中 之 所 以 用 数 子 ， 是 因为 对 它 的 逻 
辑 结构 比较 好 理解 。 


>>> heapq.heappush(hl, "q") 
>>> hl 

Le Sr 5 
>>> heapq.heappush(hl, "w") 
>>> hl 


。 heapreplace()° 
en 联合 ， 也 就 是 删除 一 个 的 同时 再 加 入 一 个 。 
列 如 : 


>>> heap 
[2, 4, 3, 9, 8] 


>>> heapq.heapreplace(heap, 3.14) 


先 简单 罗列 天 于 堆 的 几 个 常用 函数 。 那 么 堆 在 编程 实践 中 的 用 途 有 哪 

些 呢 ? 排序 十 一 个 应 用 方面 。 一 提 到 排序 ， 读 者 肯定 想到 的 是 sorted0 

或 者 列表 中 的 sort0)， 这 两 个 都 是 彰 用 的 玫 数 ， 而 且 在 一 般 情 况 下 已 经 

足够 使 用 了 。 但 如 采 使 用 堆 排 序 ， 相 对 于 其 他 排序 ， 也 有 目 己 的 优 

RR 不 同 的 特点 ， 读 者 可 以 目 行 深 入 研究 不 同 排序 
es 


6.3.5 deqgue 


有 这 样 一 个 问题 : 一 个 列表 ， 比 如 是 [L，2，3]， 在 最 右边 增加 一 个 数 
字 


oO 


这 也 太 简 单 了 ， 不 就 是 用 append0 这 个 内 建 画 数 追 加 一 个 吗 ? 
文生 向 单 ， 但 能 不 能 在 最 左边 增加 一 个 数字 呢 ? 


这 个 应 该 有 办 法 ， 不 过 得 想 想 。 读 者 在 向 下 阅读 之 前 ， 能 不 能 想 出 一 
个 方法 来 ? 


3 
>>> lst.append(4) 
>>> lst 

[2 3 

SR 1 

>>> nl.extend(lst) 
>>> nl 


[7, 1, 2, 3, 4] 


你 或 许 还 有 别 的 方法 。 但 是 ，Python 为 我 们 提供 了 一 个 更 简单 的 模块 
来 解决 这 个 问题 。 


>>> from collections import deque 


这 里 用 这 种 引用 方法 是 因为 collections 模 块 中 东西 很 多 ， 我 们 只 用 到 
deque。 


二 起 


[1，2，3，4] 


还 是 这 个 列表 ， 试 试 分 别 从 右边 和 左边 增加 数字 。 


>>> qlst = deque(1st) 


这 是 必需 的 ， 将 列表 转化 为 deque。deque 在 汉语 中 有 一 个 名 字 ， 叫 
作 “ 双 端 队 列 *”。 (double-ended queue) 。 


>>> qlst.append(5) # 从 右边 增加 
>>> qlst 

deque([1, 2, 3, 4, 5]) 

>>> qlst.appendleft(7) # 从 左边 增加 
>>> qlst 


deque([7, 1, 2, 3, 4, 5]) 


这 样 操作 多 么 容易 呀 ， 继 续 看 删除 : 


>>> qlst.pop() 
5 
>>> qlst 
deque([7, 1, 2, 3, 4]) 
>>> qlst.popleft() 


>>> qlst 
deque([1, 2, 3, 4]) 


删除 也 分 左右 。 下 面 这 个 ， 


>>> qlst.rotate(3) 
>>> qlst 


deque([2, 3, 4, 1]) 


请 读者 仔细 观察 。 


rotate0) 的 功能 是 将 Q，2，3，4] 的 让 位 连 起 来 ， 你 融 想 象 一 个 圆 环 ， 
在 上 面 有 1、2、3、4 儿 个 数字 。 如 采 一 开始 正 对 看 你 的 是 1， 依 顺 时 针 
方 回 排 列 ， 束 是 从 1 开始 的 数列 ， 如 图 6-2 所 示 。 


经 过 rotate0 ， 这 个 环 就 发 生 旋转 了 ， 如 果 是 rotate (3) ， 表示 每 个 数 
字 按 照 顺 时 针 方 回 前 进 三 个 位 置 ， 于 是 变 成 了 如 图 6-3 所 示 的 样子 。 


1 


个 


图 6-2 ”数字 排列 


图 6-3 ”数字 按 顺 时 针 方 向 前 进 


请 原 诉 我 的 后 现代 主义 超级 抽象 派 作 图 方式 。 从 图 中 可 以 看 出 ， 数 列 
变 成 了 [2，3，4，1]。rotate0) 就 好 像 在 拨 转 这 个 圆 环 。 


>>> qlst 


deque([3, 4, 1, 2]) 
>>> qlst.rotate(-1) 
>>> qlst 


如 宁 参 数 是 负数 ， 那 么 瓯 逆 时 针 转 。 
在 deque 中 ， 还 有 extend 和 extendleft 方 法 ， 读 者 可 自己 调试 。 
6.3.6 calendar 


>>> import calendar 
>>> cal = calendar.month(2015, 1) 


>>> print cal 


January 2015 
Mo Tu We Th Fr Sa Su 
二 让 33, 这 
5 6 1 8 9 0 41 
12 13.4 .15 16 718 
19 20 21 22 23 24 25 


26 27 28 29 30 31 


轻而易举 得 到 了 2015 年 1 月 的 日 历 ， 并 且 排 列 还 那么 整齐 ， 


这 束 是 


calendar 模 块 。 读 者 可 以 用 dir0) 去 查看 这 个 模块 下 的 所 有 内 容 。 为 了 让 
读者 阅读 方便 ， 将 常用 的 整理 如 下 : 


。 calendar(year,w=2,|=1,c=6) 


返回 year 年 年 万，3 个 月 一 行 ， 
每 行 长 度 为 21*W+18+2*C， 


>>> year = calendar.calendar(2015) 


>>> print year 


间隔 距离 为 c， 多 
! 是 每 星期 行 数 。 


每 日 宽度 


因为 显示 的 内 容 太 多 ， 所 以 只 将 部 分 内 容 截 取 下 来 ， 如 图 6-4 所 示 。 


January 
Mo Tu We Th Fr Sa 
3 
.00 07 A .0 Se 
2 13 14 25 46 17 
19 .20 21 22 23 24 
26 27 28 29 36 31 


其 他 部 分 殉 是 按照 上 


出 来 。 


。 isleap(year) 


判断 是 否 为 国 年 ， 古 则 返 


>>> calendar .isleap(2000) 


True 


面 的 样式 ， 将 2015 年 度 的 各 个 月 份 日 历 完 全 显示 


回 True， 


2815 


February 
Mo Tu We Th Fr Sa Su 
1 
2 3 4 6 GBS 
9 40 341 12 1334 15 
16. 17 £8,. 19 20 21 22 
23 24 25 26 27 28 


图 6-4 ”2015 年 日 历 


否则 False 。 


March 

Mo Tu We Th Fr Sa Su 
1 
> a 
9 40 11 42 13 14 15 
16 L748 9520 21 .22 
23 24 25 20,27 28 29 

36 31 


>>> Calendar .isleap(2015) 


False 


怎么 判断 一 年 是 疾 年 的 问题 ， 常 常见 诸 一 些 编程 语言 的 练习 题 ， 现 在 
用 一 个 方法 搞定 。 


。 leapdays(y1,y2) 


返回 在 y1、y2 两 年 之 间 的 图 年 尽数 ， 包 括 y1， 但 不 包括 y2， 这 有 点 如 
同 序列 的 切片 。 


>>> calendar .leapdays(2000,2004) 
1 
>>> calendar .leapdays(2000,2003) 


1 


。 month(year, month, w=2, l=1) 


返回 year 年 month 月 日 历 ， 两 行 标题 ， 一 周一 行 。 每 日 宽度 间 隅 为 w 字 
符 ， 每 行 的 长 度 为 7+w+6，1 是 每 星期 的 行 数 。 


>>> print calendar.month(2015, 5) 
May 2015 
Mo Tu We Th Fr Sa Su 
A 
C1 A 
11.12 13-14 15 16 17 
18 19 20 21 22 23 24 


25 26 27 28 29 30 31 


。 monthcalendar(year, month) 


返回 一 个 列表 ， 列 表 内 的 元 素 还 是 列表 ， 这 叫 作 购 套 列表 。 每 个 于 列 
9 都 是 从 星期 一 到 星期 日 ， 如 宁 没 有 本 月 的 日 期 ， 则 


>>> Calendar .monthcalendar(2015，5) 


[[e, 90, 9, 0, 1, 2, 3], [4, 5, 6, 7, 8, 9, 10], [11, 12, 13, 14, 15, 16, 17], [18, 19, 20, 21, 22, 23, 24], [25, 26, 2 
7, 28, 29, 30, 31]] 


读者 可 以 将 这 个 结果 和 calendarmonth (2015，5) 去 对 照 理解 。 


。 monthrange(year,month) 


返回 一 个 元 组 ， 里 面 有 两 个 整数 。 第 一 个 整数 代表 着 该 月 的 第 一 天 从 
星期 几 开 始 〈 从 0 开始 ， 依 次 为 星期 一 、 星 期 二 .……6 代 表 星 期 日 ) 。 
第 二 个 整数 代表 该 月 一 共 多 少 天 。 


(4, 31) 


从 返回 值 可 知 ，2015 年 5 月 1 日 是 星期 五 ， 这 个 月 一 共 31 天 。 这 个 结 
果 ， 也 可 以 从 日 历 中 看 到 。 


。 weekday(year,month,day) 


输入 年 月 日 ， 知 道 该 日 十 星期 几 (注意 ， 返 回 值 依然 按照 从 0 到 6 依次 
对 应 星期 一 到 星期 六 ) 


>> calendar .weekday(2015, 5, 4) # 星 期 一 
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>> calendar .weekday(2015, 6, 4) # 星 期 四 


3 


6.3.7 time 


time 模 块 很 前 用 ， 比 如 记录 某 个 程序 运行 时 间 长 短 等 ， 下 面 一 一 道 来 
其 中 的 方法 。 


。 time() 


>>> import time 
>>> time.time() 


1430745298 .391026 


time.time() 获 得 的 是 当前 时 间 〈 严 格 说 是 时 间 惟 ) ， 只 不 过 这 个 时 间 对 
人 不 友好 ， 它 是 以 1970 年 1 月 1 日 0 时 0 分 0 秒 为 计时 起 点 ， 到 当前 的 时 间 
长 度 〈 不 考虑 国 秒 ) 


UNIX 时 间 ， 或 称 POSIX 时 间 是 UNIX 或 类 UNIX 系 统 使 用 的 时 间 表 示 方 
0 时 间 1970 年 1 月 1 日 0 时 0 分 0 秒 起 至 现在 的 总 秒 数 ， 不 考 
者 国 秒 。 


现时 大 部 分 使 用 的 UNIX 的 系统 都 是 32 位 的 ， 即 它们 会 以 32 位 二 进 制 数 
字 表 示 时 间 。 但 是 它们 最 多 只 能 表示 至 协调 世界 时 间 2038 年 1 月 19 日 3 
时 14 分 07 秒 (二进制 : 01111111111111111111111111111111， 
0x7FFF:FFFF) ， 在 下 一 秒 二 进 制 数字 会 是 
10000000000000000000000000000000， (0x8000:0000) ， 这 是 负数 ， 
因此 各 系统 会 把 时 间 误 解 作 1901 年 12 月 13 日 20 时 45 分 52 秒 ( 亦 有 说 回 
归 到 1970 年 ) 。 这 时 可 能 会 令 软件 发 生 问 题 ， 导 致 系统 次 痪 。 


日 前 的 解决 方案 是 把 系统 由 32 位 转 为 64 位 。 在 64 位 系统 下 ， 此 时 间 最 
多 可 以 表示 到 292，277，026，596 年 12 月 4 日 15 时 30 分 08 秒 。 


有 没有 对 人 友好 一 点 的 时 间 显 示 呢 ? 


。 localtimel() 


>>> time.localtime() 


time.struct_time(tm year=2015, tm_mon=5, tm _ mday=4, tm_hour=21, tm min=33, tm_sec=39, tm_wday=0, tm_yday=124, tm_isdst 
=0) 


这 个 就 友好 多 了 。 得 到 的 结果 可 以 称 之 为 时 间 元 组 〈 也 有 括号 ) ， 其 
各 项 的 含义 如 表 6-1 所 示 。 


表 6-1 ”时间 元 组 各 项 含义 


tm year 


tm mon 


tm mday 


tm hour 


tm min 


tm sec 


tm wday - 周 中 的 第 几 天 


tm yday 一 年 中 的 第 几 天 


tm isdst 夏令 时 


通过 索引 能 够 得 到 相应 的 属性 ， 上 面 的 例子 中 束 得 到 了 当前 时 间 的 月 


其 实 ，time.localtime0 不 是 没有 参数 ， 它 在 默认 情况 下 ， 以 time.time0) 
的 时 间 戳 为 参数 。 言 外 之 意 束 是 说 可 以 自己 输入 一 个 时 间 戳 ， 返 回 那 
个 时 间 惟 所 对 应 的 时 间 (按照 公元 和 时 分 秒 计时 ) 。 例 如 : 


>>> time.localtime(100000) 


time.struct_time(tm year=1970, tm mon=1, tm_mday=2, tm_hour=11, tm_min=46, tm_sec=40, tm wday=4, tm_yday=2, tm_isdst=0 
) 
。 gmtimel() 


localtime() 得 到 的 是 本 地 时 间 ， 如 果 要 国际 化 ， 就 最 好 使 用 格林 威 治 时 
间 。 可 以 这 样 : 


>>> import time 


>>> time.gmtime() 


time.struct_time(tm year=2015, tm mon=5, tm_mday=4, tm_hour=23, tm_min=46, tm_sec=34, tm wday=0, tm_yday=124, tm_isdst 
=0) 


格林 威 治标 准时 间 是 指 位 于 英国 伦敦 郊区 的 旦 家 格林 威 治 天 文人 台 的 标 
准时 间 ， 因 为 本 初子 午 线 被 定义 在 通过 那里 的 经 线 。 


还 有 更 友好 的 ， 请 继续 阅读 。 


。 asctime() 


>>> time.asctime() 


'Mon May 4 21:46:13 2015"' 


time.asctime(O 的 参数 为 空 时 ， 黑 认 是 以 time.localtime0 的 值 为 参数 ， 所 
以 得 到 的 是 当前 日 期 时 间 和 星期 。 当 然 ， 也 可 以 目 己 设置 参数 : 
>>> h = time.localtime(1000000) 


>>> h 


time.struct_time(tm year=1970, tm _ mon=1, tm_mday=12, tm_hour=21, tm_min=46, tm_sec=40, tm_ wday=0, tm_yday=12, tm_isdst 
=0) 


>>> time.asctime(h) 


"Mon Jan 12 21:46:40 1970 


注意 ，time.asctime() 的 参数 必须 是 时 间 元 组 ， 类 似 上 面 那 种 。 若 不 是 
时 间 戳 ， 通 过 time.time0 得 到 的 时 间 戳 也 可 以 转化 为 上 面 的 形式 。 


。 ctime() 


>>> time.ctime() 


"Mon May 4 21:52:22 2015 


在 没有 参数 的 时 候 ， 事 实 上 是 以 time.time0 的 时 间 蕉 为 参数 ， 也 可 以 自 
定义 一 个 时 间 截 。 


>>> time.ctime(1000000) 


"Mon Jan 12 21:46:40 19790 


跟前 面 得 到 的 结果 是 一 样 的 ， 只 不 过 用 了 时 间 稚 作为 参数 。 


在 前 述 函 数 中 ， 通 过 localtime0、gmtime0 得 到 的 是 时 间 元 组 ， 通 过 
time0O 得 到 的 是 时 间 戳 。 有 的 函数 如 asctime0O 是 以 时 间 元 组 为 多 数 . 有 
ee 以 时 间 惟 为 函数 ， 这 样 做 的 目的 是 为 了 满足 编程 中 多 样 


。 mktimel() 


mktime0 也 十 以 时 间 元 组 为 参数 ， 但 是 它 返 回 的 不 是 可 读 性 更 好 的 那 
种 样式 ， 而 有 是 : 


>>> lt = time.localtime() 


St 


time.struct_time(tm year=2015, tm _ mon=5, tm_mday=5, tm_hour=7, tm_min=55, tm_sec=29, tm wday=1, tm_yday=125, tm_isdst= 
9) 


>>> time.mktime(1lt) 


1430783729.0 


0 类 似 于 localtime() 的 逆 过 程 (localtime() 是 以 时 间 玲 为 
参 交 9 


好 像 还 缺点 什么 ， 因 为 在 编程 中 ， 使 用 比较 多 的 是 “字符 串 ”， 似 乎 还 
没有 将 时 间 转 化 为 子 符 串 的 范 数 ， 这 个 应 该 有 。 


。 strftime() 
米 Da A RY = 
函数 格式 稍微 复杂 一 些 。 
Help on built-in function strftime in module time: 
strftime(...) strftime(format[, tuple]) -> string 


Convert a time tuple to a string according to a format specification. See the library reference manual for formatt 
ing codes. When the time tuple is not present, current time as returned by localtime() is used. 


将 时 间 元 组 按照 指定 格式 要 求 转化 为 字符 串 。 如 果 不 指定 时 间 元 组 ， 
束 默 认为 localtime() 值 。 说 其 复杂 是 在 于 其 format， 需 要 用 到 下 面 的 东 
西 ， 如 表 6-2 所 示 。 


表 6-2 format 格 式 定义 


含 DA 取 值 范围 (格式) 
去 掉 世纪 的 年 份 00 一 99， 如 “15” 
完整 的 年 份 如 “2015” 
指定 日 期 是 一 年 中 的 第 几 天 001 一 366 
返回 月 份 01 一 12 
本 地 简化 月 份 的 名 称 简写 英文 月 份 
本 地 完整 月 份 的 名 称 完整 英文 月 份 
该 月 的 第 几 日 如 5 月 1 日 返回 “01” 
辫 日 的 第 几时 (24 小 时 制 ) 00~23 
该 日 的 第 几时 (12 小 时 制 ) 01~12 
分 钟 00~59 
秒 00 一 59 
在 该 年 中 的 第 多 少 星期 〈 以 周 日 为 一 周 起 点 ) | 00 一 53 
同上 ， 只 不 过 是 以 周一 为 起 点 00 一 53 
一 星期 中 的 第 几 天 0 一 6 
时 区 中 国 返回 CST， 即 China Standard Time 
日 期 日 /月 /年 
时 间 时 :分 : 秒 
详细 日 期 时 间 日 /月 /年 时 :分 : 秒 
“%” 字 符 “%” 字 符 


上 下 午 AM or PM 


简要 列举 如 下 : 


>>> time.strftime("%y,%m,%d") 


T 


'15, 05, 95° 
>>> time.strftime("%y/%m/%d") 


'15/05/05" 
分 隔 从 可 以 目 由 指定 ， 有 既然 已 经 变 成 字符 串 了 ， 就 可 以 “随心 所 欲 不 逾 
类 ”了 * 
。 strptime() 
Help on built-in function strptime in module time: 
strptime(...) strptime(string, format) -> struct_time 


Parse a string to a time tuple according to a format specification. See the library reference manual for formattin 


g codes (same as strftime()). 


strptime() 的 作用 是 将 字符 串 转化 为 时 间 元 组 。 请 注意 ， 其 参数 要 指定 
两 个 ， 一 个 是 时 间 字 符 串 ， 另 外 一 个 是 时 间 字 符 串 所 对 应 的 格式 ， 格 
式 符号 用 表 6-2 中 的 。 例 如 : 


>>> today = time.strftime("%y/%m/%d") 


>>> today 
'15/05/05" 
>>> time.strptime(today, "%y/%m/%d") 


time.struct_time(tm year=2015, tm_mon=5, tm_ mday=5, tm_hour=0, tm_min=0, tm_sec=0, tm wday=1, tm_yday=125, tm_isdst=-1 
) 


6.3.8 datetime 


虽然 tme 模 块 已 经 能 够 把 有 关 时 间 方 面 的 东西 搞定 了 ， 但 是 ， 有 时 调 
0 于 是 又 出 来 了 一 个 datetime 模 块 ， 供 程序 员 们 
选 摔 ° 


datetime 模 块 中 有 以 下 几 个 类 。 


。 datetime.date: 日 期 类 ， 常 用 的 属性 有 year/month/day 。 

。 datetime.time: 时 间 类 ， 常 用 的 有 
hour/minute/second/microsecond ° 

。 datetime.datetime: 日 期 时 间 类 。 

。 datetime.timedelta: 时 间 间 隔 ， 即 两 个 时 间 点 之 间 的 时 间 长 度 。 

。 datetime.tzinfo: 时 区 类 。 


1.date 类 
通过 实例 了 解 常 用 的 属性 : 


>>> import datetime 
>>> today = datetime.date.today() 
>>> today 


其 实 这 里 生成 了 一 个 日 期 对 象 ， 然 后 操作 这 个 对 象 的 各 种 属性 。 用 
print 语 句 ， 可 以 使 视觉 更 佳 : 


>>> print today 


2015-05-05 


>>> print today.ctime() 
Tue May 5 00:00:00 2015 
>>> print today .timetuple() 


time.struct_time(tm year=2015, tm_mon=5, tm _ mday=5, tm_hour=0, tm_min=0, tm_sec=0, tm wday=1, tm_yday=125, tm_isdst=-1 


) 
>>> print today.toordinal() 


735723 


特别 注意 ， 如 果 你 妄图 用 datetime.date.year0 是 会 报错 的 ， 因 为 year 不 
是 一 个 方法 ， 必 须 这 样 : 


>>> print today.year 
2015 

>>> print today.month 
5 

>>> print today .day 


5 


进一步 看 看 时 间 鹤 与 格式 化 时 间 格 式 的 转换 : 


>>> to = today.toordinal() 

>>> to 

735723 

>>> print datetime.date.fromordinal(to) 


2015-05-85 


>>> import time 

>>> t = time.time() 

> 玫 

1430787994.80093 

>>> print datetime.date.fromtimestamp(t) 


2015-05-05 


还 可 以 更 灵活 一 些 ， 修 改 日 期 。 


>>> d1 = datetime.date(2015,5,1) 

>>> print di 

2015-05-01 

>>> d2 = d1.replace(year=2005，day=5) 
>>> print d2 


2005-05-05 


2.time 类 


也 要 生成 time 对 象 。 


>>> t = datetime.time(1,2,3) 
>>> print t 


01:02:03 


它 的 第 用 属性 : 


>>> print t.hour 

4 

>>> print t.minute 
2 

>>> print t.second 
3 

>>> t.microsecond 
0 

>>> print t.tzinfo 


None 


3.timedelta 类 
主要 用 来 做 时 间 的 运算 。 比 如 : 


>>> now = datetime.datetime.now() 
>>> print now 


2015-05-05 09:22:43.142520 


没有 讲述 datetime 类 ， 因 为 在 有 了 date 和 time 类 知识 之 后 ， 这 个 类 比较 
简单。 我 最 喜欢 now 方 法 ， 对 now 增 加 5 个 小 时 : 


>>> b = now + datetime.timedelta(hours=5) 


>>> print b 


2015-05-05 14:22:43.142520 


增加 两 周 


>>> c = now + datetime.timedelta(weeks=2) 
>>> print c 


2015-05-19 09:22:43.142520 


计算 时 间 差 : 


S55 EG = 
>>> print d 


13 days, 19:00:00 


6.3.9 Urllib 


urlib 模 块 用 于 读 取 来 自 网 上 (服务 器 上 ) 的 数据 ， 比 如 很 多 人 用 
Python 做 爬虫 程序 ， 束 可 以 使 用 这 个 模块 。 爷 看 一 个 简单 例子 : 


>>> import urllib 


>>> itdiffer = urllib.urlopen("http://www.itdiffer.com") 


这 样 就 已 经 把 我 的 网 站 www.itdiffercom 首 页 的 内 容 拿 过 来 了 ， 得 到 了 
一 个 类 似 文 件 的 对 象 。 搂 下 来 的 操作 跟 操 作 一 个 文件 一 样 。 


>>> print itdiffer.read() 
<!DOCTYPE HTML> 
<html> 
<head> 
<title>I am Qiwsir</title> 


.…,'// 因 为 内 容 太 多 ， 下 面 就 省 略 了 


这 样 就 完成 了 对 网 页 的 一 个 抓 取 。 当 然 ， 如 采 你 真 的 要 做 扑 虫 程序 ， 

还 不 是 仅仅 如 此 。 这 里 不 介绍 息 虫 程序 如 何 编写 (关于 扑 虫 的 资料 ， 

网 上 已 经 有 很 多 了 ， 读 者 可 以 搜索 并 学 习 ， 如 采 实 在 理解 有 困难 ， 还 
我 会 协助 你 的 ) ， 仅 说 明 unlib 模 块 的 常用 属性 和 方 

潜 。 


>>> dir(urllib) 


['ContentTooShortError', 'FancyURLopener', 'MAXFTPCACHE', 'URLopener', '_ all ', '_ builtins ', '_doc ', '_ file 
国内 1 


7 
'_ package ', '_ version ', '_asciire', '_ftperrors', '_have ssl', '_hexdig', '_hextochr', '_hostprog 
', '_is unicode', '_localhost', '_noheaders', '_nportprog', '_passwdprog', '_portprog', '_queryprog', '_safe map', '_s 
afe_quoters', '_tagprog', '_thishost', '_typeprog', '_urlopener', '_userprog', '_valueprog', 'addbase', 'addclosehook' 
,， 'addinfo', 'addinfourl', 'always_safe', 'base64', 'basejoin', 'c', 'ftpcache', 'ftperrors', 'ftpwrapper', 'getproxie 
s', 'getproxies environment', 'i', 'localhost', 'noheaders', 'os', 'pathname2url', 'proxy_bypass', 'proxy_bypass_envir 
onment', 'quote', 'quote plus', 're', 'reporthook', 'socket', 'splitattr', 'splithost', 'splitnport', 'splitpasswd', 
splitport', 'splitquery', 'splittag', 'splittype', 'splituser', 'splitvalue', 'ssl', 'string', 'sys', 'test1i', 'thisho 
st', 'time', 'toBytes', 'unquote', 'unquote_ plus', "unwrap'， 'url2pathname', 'urlcleanup', 'urlencode', 'urlopen', 'ur 


/ 
lretrieve'] 


选 几 个 常用 的 介绍 ， 如 果 读 者 用 到 其 他 的 ， 可 以 通过 查看 文档 了 解 。 
1.urlopen (url, data=None, proxies=None) 


urlopen0 主 要 用 于 打开 ur 文件 ， 从 而 获得 指定 un 网 页 内 容 ， 然 后 承 如 
同 操作 文件 那样 来 操作 。 


Help on function urlopen in module urllib: 


urlopen(url, data=None, proxies=None) Create a file-like object for the specified URL to read from. 


得 到 的 对 和 象 被 叫 作 “类 文件 ”， 从 名 字 中 也 可 以 理解 后 面 的 操作 了 。 先 
对 参数 说 明 一 下 。 


。 url: 远程 数据 的 路 径 ， 常 常 是 网 址 。 
。 data: 如 采 使 用 post 方 式 ， 这 里 就 是 所 提交 的 数据 。 
。 proxies: 设置 代理 。 


关于 参数 的 详细 说 明 ， 还 可 以 参考 官方 文档 ， 这 里 仅 演 示 最 常用 的 ， 
如 前 面 的 例子 那样 。 


当 得 到 了 类 文件 对 象 之 后 ， 即 变量 itdiffer 引 用 了 得 到 的 类 文件 对 象 ， 
这 个 对 象 依然 可 以 用 老 办 法 来 查看 它 的 属性 和 方法 。 


>>> dir(itdiffer) 


doc_', '_init ', '_ iter__', '_ module ', '_repr__', 'close', 'code', 'fileno', 'fp', 'getcode', 'geturl', 'h 
ers', 'i 


[' 
ead 'info', 'next', 'read', 'readline', 'readlines', 'url'] 


从 结果 中 也 可 以 看 出 ， 这 个 类 文件 对 象 也 是 可 迭代 的 ， 下 面 是 比较 各 
用 的 方法 。 


。 read()、readline()、readlines()、fileno()、close(): 都 与 文件 操作 一 
样 ， 这 里 不 再 欧 述 。 

。 info(): 返回 头 信息 。 

。 getcode(): 返回 http 状 态 码 。 

。 geturl(): 返回 url。 


简单 举例 : 


>>> itdiffer.info() 

<httplib.HTTPMessage instance at 0xb6eb3f6c> 
>>> itdiffer.getcode() 

200 

>>> itdiffer.geturl() 


'http://www.itdiffer.com' 


许多 时 候 ， 在 建立 了 类 文件 对 象 后 ， 要 通过 其 方法 得 到 某 些 数据 。 
2. 对 ul 编码、 解码 


ul 对 其 中 的 字符 有 严格 要 求 ， 不 许可 某 些 特殊 字符 直接 使 用 某 些 字 
和 从， 比如 url 中 有 空格 ， 会 目 动 将 空格 进行 处 理 ， 这 个 过 程 需 要 对 url 进 


行 编码 和 解码 。 在 进行 web 开 发 的 时 候 要 特别 注意 这 里 。 
urllib 模 块 提 供 了 un 编码 和 解码 功能 。 


quote (string[，safe]) : 对 字符 串 进行 编码 。 人 参数 safe 指 定 了 不 需 
要 编码 的 字符 。 

urllib.unquote (string) : 对 字符 串 进行 解码 。 

quote_plus (string[，safe]) : 与 urllib.quote 类 似 ， 但 这 个 方法 
用 “+” 来 蔡 换 空格 ， 而 quote 用 “%20” 来 代 巷 空格 。 

unquote_plus (string) : 对 字符 串 进 行 解码 。 

urllib.urlencode (query[，doseq]) : 将 dict 或 者 包含 两 个 元 素 的 元 
组 列表 转换 成 ur 参数。 例如 {'name':laogi'"，'age':40} 将 被 转换 

为 “name=laogi&age=40”。 
pathname2url (path) : 将 本 地 路 径 转 换 成 路径 。 
url2pathname (path) : 将 ur 路 径 转换 成 本 地 路 径 。 


看 例子 区 更 明日 了 : 


>>> du = "http://www.itdiffer.com/name=python book" 


>>> urllib.quote(du) 
'http%3A//www.itdiffer.com/name%3Dpython%20book' 
>>> urllib.quote_plus(du) 


'http%3A%2F%2Fwww. itdiffer .com%2Fname%3Dpython+book' 
注意 看 空格 的 变化 ， 一 个 被 编码 成 <%20”， 另 外 一 个 是 “+”。 


假如 在 Google 中 搜索 《和 零 基 础 学 Python》， 结 果 如 图 6-5 
不 。 


|) https://www.google.com.sg/?gfe_rd=cr&ei=mjpIVaXzCdTFuASb_YC4CQ#q= 和 零 基础 


Google 。 零 基础 python 


Web Videos Images ews Maps More Search tools 


About 442.000 results (0.24 seconds 


《 零 基础 学 Python》 by qiwsir - GitHub 
https-/github .com/qiwsir/.. /BasicPython/index.md ~ Translate this page 
Jan 7, 2015 - This is for everyone. 零 基础 学 Python. 第 零 部 分 神 上 高 楼 ， 望 尽 天 涯 路 . 哎 
叫 一 些 关 于 python 的 事情 - 开始 本 栏目 的 原因 
重 回国 数 - 222.md - 223.md - 226.md 


( 零 基础 学 习 Python、Python 入 门 ) 书籍 、 视 频 、 资 料 - GitHub 
ep com/Yixiaohan/codeparkshare ~ Translate this page 
Apr 16, 2015 - Python 初 学 者 ( 零 基 础 学 习 Python、Python 入 门 ) 书籍 、 视频 、 资料、 
社区 推荐 BR to codeparkshare development by creating an account 


图 6-5 ”在 Google 中 搜索 《 零 基础 学 Python》 


与 本 书 同 步 的 网 络 教程 在 这 次 搜索 中 排列 第 一 个 哦 。 
这 不 是 重点 ， 重 点 是 看 urll， 它 就 是 用 “+” 殖 代 空 格 。 


>>> dup = urllib.quote_ plus(du) 


>>> urllib.unquote_plus(dup) 


'http://www.itdiffer.com/name=python book' 


从 解码 效果 来 看 ， 古 比较 完美 的 逆 过 程 。 


>>> urllib.urlencode({"name":"qiwsir","web":"itdiffer.com"}) 


'web=itdiffer.com&name=qiwsir' 


如 有 果 将 来 你 要 做 一 个 网 站 ， 上 面 的 这 个 方法 或 许 会 用 到 的 。 


。 urlretrieve() 


虽然 urlopenO 能 够 建立 类 文件 对 象 ， 但 是 ， 不 等 于 将 远程 文件 保存 在 
本 地 存储 絮 中 ， urlretrieve0) 就 是 满足 这 个 需要 的 。 先 看 实例 : 


>>> import urllib 
>>> urllib.urlretrieve("http://www.itdiffer.com/images/me.jpg", "me.jpg") 
('me.jpg', <httplib.HTTPMessage instance at 0xb6ecb6cc>) 


>>> 


me.jpg 是 一 张 存 在 于 服务 器 上 的 图 片 ， 地 址 是 : 
http:Wwww.itdiffer.comyimages/me.jpg， 把 它 保存 到 本 地 存储 如 中 ， 并 
且 仍 命名 为 me.jpg。 注 意 ， 如 采 只 写 这 个 名 字 ， 表 示 存 在 局 动 Python 
交互 模式 的 那个 目录 中 ， 否 则 ， 可 以 指定 存储 具体 目录 和 文件 名 。 


在 urllib 官 方 文档 中 有 一 大 段 相 关 说 明 ， 读 者 可 以 去 认真 阅读 。 这 里 仅 
简要 介绍 一 下 相关 参数 。 


urllib.urlretrieve(url[, filename[, reporthook[, data]]]) 


url: 文件 所 在 的 网 址 。 

filename: 可 选 。 将 文件 保存 到 本 地 的 文件 名 ， 如 果 不 指定 ， 
urllib 会 生成 一 个 临时 文件 来 保存 。 

reporthook: 可 选 。 是 回调 函数 ， 当 链接 服务 器 和 相应 数据 传输 完 
毕 时 触发 本 函数 。 

data: 可 选 。 用 post 方 式 所 发 出 的 数据 。 


函数 执行 完毕 ， 返 回 的 结果 是 一 个 元 组 (filename，headers) ， 
filename 是 保存 到 本 地 的 文件 名 ，headers 是 服务 器 啊 应 头 信息 。 


#!/usr/bin/env python 


# 


coding=utf-8 


import urllib 


def go(a, b, c): 


Url = 


loc 


per = 100.0*a*b/c 
if per > 100: 
per = 100 


print "%.2f%%" % per 


"http://youxi.66wz.com/uploads/1046/1321/11410192.90d133701b06fOcc2826c3e5ac34c 620.jpg" 


al = "/home/qw/Pictures/g.jpg" 


urllib.urlretrieve(url, local, go) 


这 段 程序 束 古 要 下 载 指 定 的 图 片 ， 并 且 你 存 为 本 地 指定 位 置 的 文件 ， 


同时 要 显示 下 载 的 进度 。 上 述 文件 保存 之 后 执行 ， 显 示 如 下 效果 : 


$ python 22501.py 


0.00% 


8.13% 


16.26% 


24.40% 


32.53% 


40.66% 


48.79% 


56.93% 


65.06% 


73.19% 


81.32% 


89.46% 


97.59% 


100.00% 


到 相应 目录 中 查看 ， 能 看 到 与 网 上 地 址 一 样 的 文件 。 这 里 就 不 对 结 

截图 了 ， 读 者 自行 查看 (或 许 在 本 书 出 版 的 时 候 ， 这 张 神秘 的 图 片 你 

1 了 ， 你 应 该 把 这 视 为 正常 的 事情 ， 那 么 你 驶 换 一 张 图 片 地 
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6.3.10 urllib2 


urllib2 是 另外 一 个 模块 ， 它 跟 urllib 有 相似 的 地 方 一 ”都 是 对 ur 相关 的 
操作 ， 也 有 不 同 的 地 方 。 


有 时候 两 个 要 同时 使 用 ，urllib 模 块 和 urllib2 模 块 有 的 方法 可 以 相互 礁 
代 ， 有 的 不 能 。 看 下 面 的 属性 方法 列表 束 知 道 了 。 


>>> dir(urllib2) 


['AbstractBasicAuthHandler', 'AbstractDigestAuthHandler', 'AbstractHTTPHandler', 'BaseHandler', 'CacheFTPHandler', "FT 
PHandler', 'FileHandler', 'HTTPBasicAuthHandler', 'HTTPCoOkieProcessor', 'HTTPDefaultErrorHandler', 'HTTPDigestAuthHan 
dler', 'HTTPError', 'HTTPErrorProcessor', 'HTTPHandler', 'HTTPPasswordMgr '， 'HTTPPasswordMgrwithDefaultRealm', 'HTTPRe 
directHandler', 'HTTPSHandler', 'OpenerDirector', 'ProxyBasicAuthHandler', 'ProxyDigestAuthHandler', 'ProxyHandler', ' 


Request', 'StringI0', 'URLError', 'UnknownHandler', '_ builtins __', '_doc _', '_file _', '_name _', '__package 

'_ version ', '_cut port_re', '_opener', '_parse proxy', '_safe gethostbyname', 'addinfourl', 'base64', 'bisect', 'bu 
ild_opener', 'ftpwrapper', 'getproxies', 'hashlib', 'httplib', 'install opener', 'localhost', 'mimetools', 'os', 'pars 
e_http_list', 'parse_ keqv_list', 'posixpath', 'proxy_bypass', 'quote', 'random', 'randombytes', 're', "redquest_host ' 
'socket', 'splitattr', 'splithost', 'splitpasswd', 'splitport', 'splittag', 'splittype', 'splituser', 'splitvalue', 's 
ys', 'time', 'toBytes', 'unquote', 'unwrap', 'url2pathname', 'urlopen', 'urlparse', 'warnings'] 


读者 不 妨 将 urllib 和 urllib2 的 方法 属性 名 称 进行 比较 ， 会 发 现 它 们 之 间 
有 一 部 分 是 相同 的 ， 比 如 urlopen() 跟 urllib.openO 非 常 类 似 ， 除 了 相同 
的 就 是 不 同 的 了 。 


Request 类 


在 前 面 引用 的 内 容 中 就 明确 指出 ， 利 用 urllib2 模 块 可 以 建立 一 个 
Request 对 象 ， 建 立 Request 对 象 的 方法 就 是 使 用 Request 类 。 


>>> req = urllib2.Request("http://www.itdiffer.com") 


， 叱 的 最 直接 应 用 可 以 作为 urlopen() 方 法 的 参 
数 。 


>>> response = urllib2.urlopen(req) 
>>> page = response.read() 


因为 与 前 面 的 urllib.open ("http://www.itdiffer.com") 结果 一 样 ， 就 不 
再 警 述 。 


但 是 ， 如 果 Request 对 象 仅仅 局 限于 此 ， 似 乎 还 没有 什么 太 大 的 优势 。 
人 并 建立 类 文件 对 象 。 如 
果 是 通过 post 问 某 地 址 提交 数据 ， 也 可 以 建 六 Request 对 象 。 


import urllib 


import urllib2 


url = 'http://www.itdiffer.com/register.py' 


values = {'name' : 'qiwsir' 
'location' : 'China' 
'language' : 'Python' } 


data = urllib.urlencode(values) 


req = urllib2.Request(url, data) # 发 送 请 求 同 时 传 data 表 单 
response = urllib2.urlopen(req) # 接 受 反 馈 的 信息 
the_page = response.read() # 读 取 反 馈 的 内 容 


如 果 读 者 照抄 上 面 的 程序 ， 然 后 运行 代码 ， 肯 定 是 报错 的 ， 因 为 那个 
ul 中 没有 相应 的 接受 客户 端 post 上 去 的 data 的 程序 文件 ， 为 了 让 程序 运 
行 ， 读 者 可 以 开发 接收 数据 的 程序 。 上面 的 代码 只 是 以 一 个 例子 来 显 
人 并 且 在 这 个 例子 中 以 post 方 式 提交 数 


在 网 站 中 ， 有 的 会 通过 User- Agent 来 判断 访问 着 是 测 锅 器 还 是 男 的 程 
序 ， 如 采 通 过 别 的 程序 访问 ， 它 有 可 能 拒绝 。 这 时 候 我 们 编写 程序 去 
访问 ， 就 要 设置 headers 了 。 设 置 方法 是 : 


User_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' 


headers = { 'User-Agent' : user_agent } 


然后 重新 建立 Request 对 和 象 


req = urllib2.Request(url, data, headers) 


再 用 urlopen() 方 法 访问 : 


response = urllib2.urlopen(req) 


除了 上 面 的 演示 之 外 ，urllib2 模 块 的 东西 还 有 很 多 ， 比 如 还 可 以 : 


。 设置 HTTP Proxy 
。 设置 Timeout 值 
。 目 动 redirect 

。 处 理 cookie 


当 需 要 用 到 的 时 候 可 以 查看 文档 或 者 去 网 上 
索 。 


6.3.11 XML 
XML 在 软件 领域 用 途 非 常 广泛 ， 有 名 人 日: 


“ 当 XML (扩展 标记 语言 ) 于 1998 年 2 月 被 引入 软件 工业 界 时 ， 它 给 整 
个 行业 带 来 了 一 场 风 暴 。 有 史 以 来 第 一 次 ， 这 个 世界 拥有 了 一 种 用 来 
结构 化 文档 和 数据 的 通用 且 适 应 性 强 的 格式 ， 它 不 仅仅 可 以 用 于 
Web， 而 且 可 以 被 用 于 任何 地 方 。” 


一 一 《Designing With Web Standards Second Edition》 , Jeffrey Zeldman 


如 果 要 对 XML 做 一 个 定义 式 的 说 明 ， 就 不 得 不 引用 w3school 里 面 傈 少 
而 明快 的 说 明 : 


XML 指 可 扩展 标记 语言 (EXtensible Markup Language) 。 
XML 是 一 种 标记 语言 ， 很 类 似 于 HTML 。 

XML 的 设计 宗旨 是 传输 数据 ， 而 非 显 示 数 据 。 

XML 标签 没有 被 预定 义 ， 你 需要 目 行 定义 标签 。 
XML 被 设计 为 具有 目 我 描述 性 。 

XML 是 wW3C 的 推荐 标准 。 


如 果 读 者 要 详细 了 解 和 学 习 XML ， 可 以 阅读 w3school 的 教程 。 


XML 的 重要 在 于 它 是 用 来 传输 数据 的 ， 因 此 ， 等 别 是 在 Web 编 程 中 ， 
经 市 要 用 到 。 有 了 它 让 数据 传 匠 变 得 商 单 了 ， 这 人 么 重要 ，Python 当 然 


支持 


一 般 来 讲 ， 一 个 引 人 关 注 的 东西 ， 总 会 有 很 多 人 从 不 同 侧面 去 关注 。 
在 编程 语言 中 也 是 如 此 ， 所 以 ， 对 XML 这 个 明星 似 的 东西 ，Python 提 
供 了 多 种 模块 来 处 理 。 


。 Xml.dom.* 模 块 : Document Object Model。 适 合用 于 处 理 DOM 
API。 它 能 够 将 XML 数 据 在 内 存 中 解析 成 一 棵 树 ， 然 后 通过 对 树 
的 操作 来 操作 XML， 但 是 ， 由 于 这 种 方式 将 XML 数 据 映 喘 到 内 存 
中 的 树 ， 导 致 比较 慢 ， 且 消耗 更 多 内 存 。 

xml.sax.* 模 块 : simple API for XML。 由 于 SAX 以 流 式 读 取 XML 文 
件 ， 从 而 速度 较 快 ， 且 少 占 用 内 存 ， 但 是 操作 上 稍 复杂 ， 需 要 用 
户 实现 回调 函数 。 

xml.parser.expat: 是 一 个 直接 的 ， 低 级 一 点 的 基于 C 的 expat 的 语法 
分 析 右 。expat 接 口 基于 事件 反馈 ， 有 点 像 SAX 但 又 不 太 像 ， 因 为 
它 的 接口 并 不 是 完全 规范 于 expat 库 的 。 

xml.etree.ElementTree (以 下 简称 ET) : 元 素 树 。 它 提供 了 轻 量 级 
的 Python 式 的 API， 相 对 于 DOM，ET 快 了 很 多 ， 而 且 有 很 多 令 人 
愉悦 的 API 可 以 使 用 ， 相 对 于 SAX，ET 也 有 ET.iterparse 提 供 了 “在 
空中 ”的 处 理 方式 ， 没 有 必要 加 载 整 个 文档 到 内 存 ， 广 省 内 存 。 
ET 性 能 的 平均 值 和 SAX 差 不 多 ， 但 是 API 的 效率 更 高 一 点 而 且 使 
用 起 来 很 方便 。 


所 以 ， 我 用 xml.etree.ElementTree 。 
ElementTree 在 标准 库 中 有 两 种 实现 ， 一 种 是 纯 Python 实 现 : 


xmletree.ElementTree， 另 外 一 种 是 : xml.etree.cElementTree 。 


如 果 读 者 使 用 的 是 Python 2.x， 可 以 像 这 样 引 入 模块 : 


try: 
import xml.etree.cElementTree as ET 
except ImportError: 


import xml.etree.ElementTree as ET 


如 果 是 Python 3.3 以 上 ， 就 没有 这 个 必要 了 ， 只 需要 一 句 话 import 
xml.etree.ElementTree as ET 即 可 ， 然 后 由 模块 目 动 来 寻找 适合 的 方 


式 。 显 然 Python 3.x 相 对 Python 2.x 有 了 很 大 进步 。 
1. 遍 历 查 询 
先 要 做 一 个 XML 文档 ， 用 w3school 中 的 一 个 例子 ， 如 图 6-6 所 示 。 


过 十 用 图 来 表示 的 ， 先 把 这 柠 树 写成 XML 文档 
ss 


<bookstore> 

<book category="COOKING"> 
<title lang="en">Everyday Italian</title> 
<author>Giada De Laurentiis</author> 
<year>2005</year> 
<price>30.00</price> 

</book> 

<book category="CHILDREN"> 
<title lang="en">Harry Potter</title> 
<author>J K. Rowling</author> 
<year>2005</year> 
<price>29.99</price> 

</book> 
<book category="WEB"> 
<title lang="en">Learning XML</title> 
<author>Erik T. Ray</author> 
<year>2003</year> 
<price>39.95</price> 

</book> 


</bookstore> 


根 元 素 
<bookstore» 
"| 
<book= 


次 本 ; 
] kk, Rowling 


尾 性 : 
“Category” 
元 素 : 元 素 : 
<YBar> <price> 


文本 : 
Harry Potter 


图 6-6 XML 树 


将 XML 保存 为 名 为 22601.xml 的 文件 ， 接 下 来 就 是 以 它 为 对 象 ， 练 习 各 
种 招数 了 。 


>>> import xml.etree.cElementTree as ET 


用 这 种 方式 引入 ， 在 编程 实践 中 推荐 读者 使 用 try...except.… 
Rs 


>>> tree = ET.ElementTree(file="22601.xml") 
>>> tree 


<ElementTree object at 90xb724cc2c> 


人 然后 通过 根 节 点 向 下 开始 读 取 各 个 元 素 (element 
到 6 


在 上 述 XML 文 档 中 ， 根 元 素 是 bookstore， 它 没有 属性 ， 或 者 属性 为 


es | 
en 
>>> root = tree.getroot() # 获 得 根 
>>> root.tag 
'bookstore' 
>>> root.attrib 


0 


要 想 将 根 下 面 的 元 素 都 读 出 来 ， 可 以 : 


5% Or child Th roote: 


print child.tag, child.attrib 


book {'category': 'COOKING'} 
book {'category': 'CHILDREN'} 


book {'category': 'WEB'} 


也 可 以 用 下 面 方法 读 取 指定 元 素 的 信息 : 


>>> root[0].tag 

"book' 

>>> root[0].attrib 

{'category': 'COOKING'} 

>>> root[9] .text # 无 内 容 


'\n 


再 深入 一 层 ， 束 有 内 容 了 : 


>>> root[0][90].tag 
'title' 

>>> root[0][0] .attrib 
{'lang': 'en'} 

>>> root[0][0].text 


"Everyday Italian' 


对 于 ElementTree 对 象 ， 有 一 个 iter 方 法 可 以 对 指定 名 称 的 子 节 点 进 
度 优 先 通 历 。 例 如 : 


>>> for ele in tree.iter(tag="book"): # 沉 历 名 称 为 book 的 节点 


print ele.tag, ele.attrib 


book {'category': 'COOKING'} 
book {'category': 'CHILDREN'} 


book {'category': 'WEB'} 


>>> for ele in tree.iter(tag="title"): # 议 历 名 称 为 title 的 节点 


print ele.tag, ele.attrib, ele.text 


title {'lang': "en'} Everyday Italian 
title {'lang': 'en'} Harry Potter 


title {'lang': 'en'} Learning XML 


如 打 不 指定 元 系 名 称 ， 怠 是 将 所 有 的 元 聚 般 历 一 过 。 


>>> for ele in tree.iter(): 


print ele.tag, ele.attrib 


bookstore {} 

book {'category': 'COOKING'} 
title {'lang': 'en'} 

author {} 

year {} 

price {} 

book {'category': 'CHILDREN'} 
title {'lang': 'en'} 

author {} 

year {} 

price {} 

book {'category': 'WEB'} 
title {'lang': 'en'} 

author { 


year {} 


price {} 


除了 上 面 的 方法 ， 还 可 以 通过 路 径 搜索 到 指定 的 元 素 ， 读 取 其 内 容 ， 
这 就 是 xpath。 此 处 对 xpath 不 详解 ， 如 采 要 了 解 可 以 到 网 上 搜索 有 关 信 


/JU 


>>> for ele in tree.iterfind("book/title"): 


print ele.text 


Everyday Italian 
Harry Potter 


Learning XML 


利用 findall0) 方 法 ， 也 可 以 实现 查找 功能 : 


>>> for ele in tree.findall("book"): 
title = ele.find('title').text 
price = ele.find('price').text 
lang = ele.find('title').attrib 


print title, price, lang 


Everyday Italian 30.00 {'lang': 'en'} 
Harry Potter 29.99 {'lang': 'en'} 


Learning XML 39.95 {'lang': 'en'} 


2. 编 辑 


除了 读 取 有 关 数 据 之 外 ， 还 能 对 XML 进 行 编辑 ， 即 增 、 删 、 改 、 查 功 
能 ， 还 是 以 上 面 的 XML 文 档 为 例 : 


>>> ro ot[1].tag 


>>> del root[1] 
>>> for ele in root: 


print ele.tag 


如 此 ， 成 功 删 除了 一 个 节点 ， 原 来 有 三 个 book 广 点 ， 现 在 就 还 简 两 个 
了 。 打 开源 文件 再 看 看 ， 是 不 是 正好 少 了 第 二 个 下 点 呢 ? 一 定 很 让 你 
失望 ， 谣 文件 居然 没有 变化 。 


的 确 如 此 ， 源 文件 没有 变化 ， 因 为 至 此 的 修改 动作 ， 还 停留 在 内 存 
中 ， 还 没有 将 修改 结果 输出 到 文件 。 不 要 忘记 ， 我 们 是 在 内 存 中 建立 
的 ElementTree 对 象 。 再 这 样 做 : 


>>> import os 
>>> outpath = os.getcwd() 


>>> file = outpath + "/22601.xml" 


把 当前 文件 路 径 拼 流 好 。 然 后 : 
再 看 源 文 件 ， 已 经 变 成 两 个 节点 了 。 
除了 删除 ， 也 能 够 修改 : 


>>> for price in root.iter("price"): # 原 来 每 本 书 的 价格 


print price.text 


30.00 


39.95 


>>> for price in root.iter("price"): # 每 本 上 涨 7 元 ， 并 且 增 加 属性 标记 


new_price = float(price.text) +7 
price.text = Str(new_price) 


price.set("updated", "up") 


>>> tree.write(file) 


查看 源 文件 : 


<bookstore> 
<book category="COOKING"> 
<title lang="en">Everyday Italian</title> 
<author>Giada De Laurentiis</author> 
<year>2005</year> 
<price updated="up">37.0</price> 
</book> 
<book category="WEB"> 
<title lang="en">Learning XML</title> 
<author>Erik T. Ray</author> 
<year>2003</year> 
<price updated="up">46.95</price> 
</book> 


</bookstore> 


不 仅 价格 修改 了 ， 而 且 在 price 标 签 里 面 增加 了 属性 标记 。 


上 面 用 del 来 删除 某 个 元 素 ， 其 实 ， 在 编程 中 用 的 不 多 ， 较 多 使 用 
remove() 方 法 。 比 如 要 删除 price>40 的 书 。 可 以 这 么 做 : 


>>> for book in root.findall("book"): 
price = book.find("price" ) .text 
if float(price) > 40.0: 


root.remove(book) 


>>> tree.write(file) 


i 
于 是 就 这 样 了 : 
<bookstore> 
<book category="COOKING"> 
<title lang="en">Everyday Italian</title> 
<author>Giada De Laurentiis</author> 
<year>2005</year> 
<price updated="up">37.0</price> 
</book> 


</bookstore> 


接 下 来 束 要 增加 元 素 了 。 


>>> import xml.etree.cElementTree as ET 

>>> tree = ET.ElementTree(file="22601.xml") 

>>> root = tree.getroot() 

>>> ET.SubElement(root, "book") # 在 root 里 面 添加 book 节 点 
<Element 'book' at QOxb71c7578> 

>>> for ele in root: 


print ele.tag 


book 

book 

>>> b2 = root[1] # 得 到 新 增 的 book 节 点 
>>> b2.text = "python" # 添 加 内 容 


>>> tree.write("22601.xml") 


查看 产 文件 : 


<bookstore> 

<book category="COOKING"> 
<title lang="en">Everyday Italian</title> 
<author>Giada De Laurentiis</author> 
<year>2005</year> 
<price updated="up">37.0</price> 

</book> 

<book>python</book> 


</bookstore> 


3. 常 用 属性 和 方法 总 结 

ET 里 面 的 属性 和 方法 不 少 ， 这 里 列 出 常用 的 ， 供 使 用 中 备查 。 
(1) Element 对 象 

常用 属性 如 下 。 


tag: string， 元 素数 据 种 类 。 

text: string, 元 素 的 内 容 。 

attrib: dictionary， 元 素 的 属性 字典 。 
tail: string， 元 素 的 尾 形 。 


针对 属性 的 操作 如 下 。 


clear0: 清空 元 素 的 后 代 、 属 性 、text 和 tail 也 设置 为 None 。 

get (key，default=None) : 获取 key 对 应 的 属性 值 ， 如 该 属性 不 
存在 则 返回 default 值 。 

J 根据 属性 字典 返回 一 个 列表 ， 列 表 元 素 为 (key， 

Value) 。 

keys(): 返回 包含 所 有 元 素 属 性 键 的 列表 。 

set (key，value) : 设置 新 的 属性 键 与 值 。 


针对 后 代 的 操作 如 下 。 


append (subelement) : 添加 直系 子 元 素 。 

extend (subelements) : 增加 一 串 元 素 对 象 作 为 子 元 素 。 

find (match) : 寻找 第 一 个 匹配 子 元 素 ， 匹 配对 象 可 以 为 tag 或 
path。 

findall (match) : 寻找 所 有 匹配 子 元 素 ， 匹 配对 象 可 以 为 tag 或 
path。 

findtext (match) : 寻找 第 一 个 匹配 子 元 素 ， 返 回 其 text 值 。 匹 配 
对 象 可 以 为 tag 或 path 。 

insert (index，element) : 在 指定 位 置 插 入 子 元素 。 

iter (tag=None) : 生成 遍历 当前 元 素 所 有 后 代 或 者 给 定 tag 的 后 代 
的 迭代 絮 。 

iterfind (match) : 根据 tag 或 path 查 找 所 有 的 后 代 。 

itertext(): 遇 历 所 有 后 代 并 返回 text 值 。 


。remove (subelement) : 删除 子 元 素 。 
(2) ElementTree 对 象 


find (match ) 

findall (match) 

findtext (match, default=None) 

getroot(): 获取 根 方 点。 

iter (tag=None) 

iterfind (match) 

parse (source，parser=None) : 装载 xml 对 象 ，source 可 以 为 文件 
名 或 文件 类 型 对 象 。 

。 Write (file, encoding="us-ascii", xml declaration=None, 
default_namespace=None, method="xml") 


6.3.12 JSON 


就 传递 数据 而 言 ，XML 是 一 种 选择 ， 还 有 男 外 一 种 一 一 JSON， 它 是 
一 种 轻 量 级 的 数据 交换 格式 ， 如 果 读 者 要 做 Web 编 程 ， 则 会 用 到 它 。 
根据 维基 百科 的 相关 内 容 ， 对 JSON 了 解 一 下 : 


JSON (JavaScript Object Notation) 是 一 种 由 道格拉斯 : 克 罗 克 福特 构想 
设计 、 轻 量 级 的 数据 交换 语言 ， 以 文字 为 基础 ， 且 易于 让 人 阅读 。 尽 
管 JSJON 是 JavaScript 的 一 个 子 集 ， 但 JSON 是 独立 于 语言 的 文本 格式 ， 

并 且 采 用 了 类 似 于 C 语 言 家 族 的 一 些 习惯 。 


天 于 JSON 更 为 详细 的 内 容 ， 可 以 参考 网 站 : http:/www:json.org 。 
从 上 述 网 站 摘 取 部 分 内 容 ， 了 解 一 人 JSON 的 结构 。 
JSON 建 构 于 两 种 结构 : 


。 “名 称 / 值 ? 对 的 集合 (A collection of name/value pairs) ， 不 同 的 语 
言 中 ， 它 被 理解 为 对 象 (object) 、 纪 录 (record) 、 结 构 
(struct) 、 字 典 《dictionary) 、 哈 希 表 (hash table) 、 有 键 列 表 
(keyed list) 或 者 关联 数组 (associative array) 
值 的 有 序列 表 (An ordered list of values) ， 在 大 部 分 语言 中 ， 它 
被 理解 为 数组 (array) 


Python 标准 库 中 有 JSON 模 块 ， 主 要 执行 序列 化 和 反 序 列 化 功能 。 


。 序 列 化 : encoding， 把 一 个 Python 对 象 编码 转化 成 JSON 字 符 串 。 
。 反 序 列 化 : decoding， 把 JSON 格 式 字 符 串 解码 转换 为 Python 数据 


对 象 。 
1. 基 本 操作 
JSON 模 块 相 对 XML 单纯 了 很 多 : 


>>> import json 
>>> json. all _ 


['dump', 'dumps', 'load', 'loads', 'JSONDecoder', 'JSONEncoder'] 


。 encoding: dumps() 


>>> data = [{"name":"qiwsir", "lang":("python", "english"), "age":40}] 
>>> print data 

[{'lang': ('python', 'english'), 'age': 40, 'name': 'qiwsir'}] 

>>> data_json = json.dumps(data) 

>>> print data_json 


[{"lang": ["python"，"english"]，"age": 40，"name": "qiwsir"}] 


encoding 的 操作 是 比较 简单 的 ， 请 注意 观察 data 和 data_json 的 不 同 
lang 的 值 从 元 组 变 成 了 列表 ， 还 有 不 同 : 
>>> type(data_json) 


>>> type(data) 


<type 'list'> 


。 decoding: loads() 
decoding 的 过 程 也 像 上 面 一 样 简单 : 


>>> new_data = json.loads(data_ json) 


>>> new_data 


[{u'lang': [u'python', u'english'], u'age': 40, u'name': u'gqiwsir'}] 


需要 注意 的 是 ， 解 码 之 后 并 没有 将 元 组 还 原 。 


上 面 的 data 都 不 是 很 长 ， 还 能 凑合 阅读 ， 如 采 很 长 了 ， 阅 读 束 有 难度 
了 “。 所 以 ，JSON 的 dumps0 提 供 了 可 选 参数 ， 利 用 它们 能 在 输出 上 对 
人 更 友好 (这 对 机 器 是 无 所 谓 的 ) 。 


>>> data_j = json.dumps(data, sort_keys=True, indent=2) 


>>> print data j 


sort_keys=True 意 忆 是 按照 键 的 字典 顺序 排序 ，indent=2 是 让 每 个 键 / 值 
对 显示 的 时 候 ， 以 缩 进 两 个 字符 对 齐 ， 这 样 的 视觉 效果 好 多 了 。 


2. 大 JSON 字 符 串 


如 果 数 据 不 是 很 大 ， 那 么 上 面 的 操作 足够 了 ， 但 现在 是 “大 数据 ”时 代 
了 ， 随 便 一 个 什么 业务 都 在 说 目 己 是 大 数据 ， 显 然 不 能 总 让 JSON 很 

小 。 前 面 的 操作 方法 是 将 数据 都 读 入 内 存 ， 如 采 数 据 量 太 大 了 内 存 会 
爆满 ， 这 肯定 是 不 行 的 。 怎 么 办 ? JSON 提 供 了 load0) 男 数 和 dump() 范 
数 解决 这 个 问题 ， 注 意 ， 跟 已 经 用 过 的 函数 相 比 是 不 同 的 ， 请 仔细 观 
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>>> import tempfile # 临 时 文件 模块 
>>> data 
[{'lang': ('python', 'english'), 'age': 40, 'name': 'qiwsir'}] 


>>> f = tempfile.NamedTemporaryFile(mode='w+') 
>>> json.dump(data, f) 

>>> f.flush() 

>>> print open(f.name, "r").read() 


[{"lang": ["python", "english"], "age": 40, "name": "qiwsir"}] 
6.4 第 三 方 库 


标准 库 的 内 容 已 经 非常 多 了 ， 前 面 仅仅 列举 儿 个 ， 但 是 Python 给 编程 
者 的 文 持 不 仅仅 在 于 标准 库 ， 还 有 不 可 胜 数 的 第 三 方 库 。 因 此 ， 作 为 


一 个 Pythoner， 即 使 你 达到 了 master 的 水 平 ， 在 做 某 个 事情 之 前 最 好 在 

网 上 搜索 一 下 是 否 有 标准 库 或 者 第 三 方 库 能 奉 你 完成 。 因 为 ， 伟 大 的 

如 采 我 比 别 人 看 得 更 远 ， 那 是 因为 我 站 在 巨人 
% 月 O 〇 


编程 殉 更 要 站 在 巨人 的 肩 上 ， 标 准 库 和 第 三 方 库 以 及 其 提供 者 惑 是 巨 
人 ， 我 们 本 应 当 谦 卑 地 加 其 学 习 ， 并 应 用 其 成 采 。 


6.4.1 ”安装 第 三 方 库 


安 逆 第 三 方 库 的 方法 有 几 种 ， 不 同方 法 有 不 同 的 优 缺 点 ， 读 者 可 以 根 
据 目 己 的 喜好 或 者 实际 的 工作 情景 来 选择 使 用 。 


方法 一 :利用 源码 安装 


在 github.com 网 站 可 以 下 载 第 三 方 库 的 源码 (注意 ，github 不 是 源码 的 
唯一 来 源 ， 只 不 过 很 多 源码 都 在 这 个 网 站 上 ， 我 也 喜欢 既 了 ) ， 得 到 
源码 之 后 ， 在 本 地 安 闭 。 


如 果 你 下 载 的 是 一 个 文件 包 ， 即 得 到 的 源码 格式 为 zip 或 tar.zip 或 tar.bz2 
的 压缩 文件 ， 需 要 先 解 压缩 ， 然 后 进入 其 目录 (文件 夹 ) ; 如 果 你 能 
熟练 使 用 git 命 令 ， 可 以 直接 从 github 中 clone 源 码 到 本 地 计算 机 上 ， 然 
后 再 进入 该 日 录 (文件 夹 ) 。 进 去 之 后 通常 会 看 见 setup.py 文 件 。 如 果 
是 Linux 操 作 系 统 或 者 苹果 计算 机 (我 是 用 Ubuntu 系统 ， 特 别 推荐 
哦 ) ， 就 在 这 里 运行 shell， 执 行 命令 : 


python setup.py install 


J 需要 打开 命令 行 模式 ， 执 行 上 述 指令 即 
pI o 


如 此 ， 葡 能 把 这 个 第 三 库 安 闭 到 系统 里 。 上 有 具体 位置 ， 要 视 操 作 系统 和 
你 当初 安装 Python 环境 时 设置 的 路 径 而 定 。 默 认 条 件 下 ，Windows 是 

在 C:\Python2.7\Lib\site-packages，Linux 在 /usr/local/lib/python2.7/dist- 

packages (这 个 只 是 参考 ， 不 同 发 行 版 会 有 差别 ， 具 体 请 读者 根据 自 

己 的 操作 系统 找 找 ) ，Mac 在 /Library/Python/2.7/site-packages 。 


这 种 安 硝 的 方法 有 时 候 厅 烦 一 些 ， 但 是 比较 灵活 ， 主 要 体现 在 : 


。 可 以 下 载 安装 目 己 选 定 的 任意 版 本 的 第 三 方 库 ， 比 如 最 新 版 ， 或 
者 更 早 的 某 个 版 本 ， 所 以 在 某 些 有 特殊 需要 的 时 候 ， 和 常常 使 用 这 
种 方式 安装 第 三 方 库 。 
。 通过 安装 设置 可 以 指定 安装 目 未 ， 目 由 度 比较 高 。 
有 安 闭 加 要 有 季 载 ， 划 载 所 安 逆 的 库 非 党 简单 ， 只 需要 到 相应 系统 的 
site-packages 目 了 永 ， 直 接 删 掉 库 文件 即 可 。 


用 源码 安 狠 ， 不 是 我 推荐 的 ， 我 推荐 的 古 用 第 三 方 库 的 管理 工具 安 
装 。 


有 一 个 网 站 专门 用 来 存储 第 三 方 库 ， 在 这 个 网 站 上 的 所 有 软件 包 ， 都 
能 用 pip 或 者 easy_install 这 种 安装 工具 来 安装 ， 网 站 的 地 址 : 
https://pypi.python.org/pypi ° 


pip 是 一 个 以 Python 计算 机 程序 语言 写成 的 软件 包 管 理 系 统 ， 可 以 安装 
和 管理 软件 包 ， 另 外 很 多 软件 包 也 可 以 在 “Python 软件 包 索 引 ”(〈 英 

语 : J Package Index， 简 称 PyPI) 中 找到 。 ( 源 自 《维基 百 
科 》 


目 和 完 ， 要 安 狠 pip。 如 果 读 者 跟 我 一 样 ， 用 的 是 Ubuntu 系 统 或 者 其 他 茶 

种 Linux 系 统 ， 束 用 不 到 这 个 操作 ， 因 为 在 安 流 操作 系统 的 时 候 已 经 点 

ee 。 如 采 因 为 什么 原因 而 没有 安装 ， 可 以 使 用 如 
夺 : 


。 Debian and Ubuntu: 


sudo apt-get install python-pip 


。 Fedora and CentOS: 
当然 ， 也 可 以 下 载 文件 get-pip.py ， 然 后 执行 python get-pip.py 来 安装 ， 


下 载 地 址 是 : https://bootstrap.pypa.io/get-pip.py。 这 个 方法 也 适用 于 
Windows 系 统 。 


对 于 Windows 操 作 系统 ， 如 采 你 安装 了 有 某 个 版 本 的 Python， 特 别 注意 
到 安装 目录 中 找 一 找 ， 一 般 情 况 下 pip 束 已 经 默认 安 效 好 了 。 


pip 就 这 样 安装 好 了 ， 非 常 简 单 吧 。 


然后 你 就 可 以 淋漓 尽 致 地 安装 第 三 方 库 了 ， 之 所 以 那么 痛快 ， 是 因为 
只 需要 执行 pip install XXXXXX (XXXXXX 代 表 第 三 方 库 的 名 字 ) 即 
5 


第 三 方 库 安装 完毕 。 

6.4.2 ”以 requests 为 例 

Cd 2 a te 方 库 的 安装 和 使 用 。 之 所 以 选 这 个 ， 是 
I 绍 了 urllib 和 urllib2 两 个 标准 库 的 模块 ， 与 之 有 类 似 功能 的 


三 方 译 中 requests 也 是 一 个 用 于 在 程序 中 进行 http 协 议 下 的 get 和 post 
请 请 求 的 模块 并 且 被 网 友 说 成 “好 用 的 要 器 ”。 


说 明 : 下 面 的 内 容 是 根据 网 友 1world0x00 提 供 的 文章 修改 而 成 的 ， 对 
她 表示 万 分 感激 。 


1. 安 装 


pip install requests 


安装 好 之 后 ， 在 交互 模式 下 : 


>>> import requests 


> dir(requests) 
上 Co nee onErr ,， 'HTTPError', 'NullHandle 'PreparedRequest', 'Requ ues "Requ ues Ee cepti on "Response ， "Session 
Tm eout', 'Too Ma nyRedir ects' ee dred’ '_ author_ _', '_ build bu i1ti copyr os nD '_doc 
， '—file _', 1i cen se package ',，"'_path_', ' title on "adal So pi', 'au 
th "certs ， "code ompat "coaki es， 由 "exceptions'， 'get', 'head， Rs log91 oe nodels 'opti 
ons', "packages ' eh "po ost， "put ‘reque est', 'session', 'sessions', 'stat Us_co odes es， il1s， ] 


从 上 面 的 列表 中 可 以 看 出 ， 在 http 中 常用 到 的 get 、cookies、post 等 都 赫 
然 在 目 。 


2.get 请 求 


>r = requests.get("http://www.itdiffer.com") 


得 到 一 个 请 求 的 实例 ， 然 后 : 


>>> r.cookies 


<<class 'requests.cookies.RequestsCookieJar'>[]> 


这 个 网 站 对 客户 端 没 有 写 任 何 cookies 内 容 ， 换 一 个 看 看 : 


>>> r = requests.get("http://www.1worldOx00.com") 
>>> r.cookies 


<<class 'requests.cookies.RequestsCookieJar'> 

[Cookie(version=0, name='PHPSESSID', value='buqj70k7f9rrg5iemsvatveda2', port=None, port_specified=False, domain="'www. 
lworldOx00.com', domain_specified=False, domain_initial_ dot=False, path='/', path_specified=True, secure=False, expir 
es=None, discard=True, comment=None, comment_url=None, rest={}, rfc2109=False)]> 


仔细 观察 ， 是 不 是 看 到 了 cookie 的 name 和 value， NN 关 知 识 
的 了 解 ， 是 不 是 有 一 种 钠 然 开朗 悦 然 大 悟 的 感觉 


继续 ， 还 有 别 的 属性 可 以 看 看 : 


>>> r.headers 


{'x-powered-by': 'PHP/5.3.3', 'transfer-encoding': 'chunked', 'set- 

cookie': 'PHPSESSID=buqj70k7f9rrg5lemsvatveda2; path=/', 'expires': 'Thu, 19 Nov 1981 08:52:00 GMT', 'keep- 
alive': 'timeout=15, max=500', 'server': 'Apache/2.2.15 (Cent0S)'， 'connection': 'Keep-Alive', 'pragma': 'no- 
cache', 'cache-control': 'no-store, no-cache, must-revalidate, post-check=0, pre- 

check=0', 'date': 'Mon, 10 Nov 2014 01:39:03 GMT', 'content-type': 'text/html; charset=UTF-8', 'x- 

pingback': 'http://www.1worldOx00. com/index.php/action/xmlrpc'} 


>>> r.encoding 


'UTF-8"' 


>>> r.status_code 


200 


这 些 都 是 在 客户 端 看 到 的 网 页 的 基本 属性 
下 面 这 个 比较 长 ， 是 网 页 的 内 容 ， 仪 仅 截取 显示 的 部 分 : 


>>> print r.text 


<!DOCTYPE html> 
<html lang="zh-CN"> 
<head> 
<meta charset="utf-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1.0"> 
<title>1worldox00sec</title> 
<link rel="stylesheet" 
href="http://www.1worldOx00 .com/usr/themes/default/style.min.css"> 
<link rel="canonical" href="http://www.1worldOx00.com/" /> 


<link rel="stylesheet" type="text/css" 


href="http://www.1worldOx00.com/usr/plugins/CodeBox/css/codebox.css" /> 


<meta name="description" content=" 爱 生活 ， 爱 拉 芳 。 不 装 通 还 能 做 朋友 。" /> 
<meta name="keywords" content="php" /> 


<link rel="pingback" href="http://www.1worldOx00.com/index.php/action/xmlrpc" /> 


请 求 发 出 后 ，requests 会 基于 http 头 部 对 相应 的 编码 做 出 有 根据 的 推 
测 ， 当 你 访问 rtext 时 ，requests 使 用 其 推测 的 文本 编码 。 你 可 以 找 出 
requests 使 用 了 什么 编码 ， 并 且 能 够 使 用 rcoding 属 性 来 改变 它 。 


>>> r.content 


'\xef\xbb\xbf\xef\xbb\xbf<!DOCTYPE html>\n<html lang="zh-CN">\n <head>\n <meta charset="utf- 
8">\n <meta name="viewport" content="width=device- 

width, initial- scale=1.0">\n <title>1worldox00sec</title>\n <link rel="stylesheet" href="http: //www.1worldOx00 
.Ccom/usr/themes/default/style.min.css">\n Ln srys 


以 二 进 制 的 方式 打开 服务 器 并 返回 数据 。 
3.post 请 求 


假如 你 要 向 某 个 服务 器 发 送 一 些 数据 ， 一 般 情况 下 ， 使 用 的 就 古 
post， 实 现 方式 也 比较 简单 ， 只 需要 传递 一 个 字典 给 data 参 数 。 


>>> import requests 
>>> payload = {"key1i":"value1i", "key2":"value2"} 
>>> r = requests.post("http://httpbin.org/post") 


>>> rl = requests.post("http://httpbin.org/post", data=payload) 


r 没 有 提供 data 参 数值 ， 得 到 的 效果 厦 : 


{ 
RES {Es 
"qabkars hs 
"Porm: Tl 
"headers™: 1{ 
TREEEDE 3 YX/ 
"Accept-Encoding": "gzip, deflate", 
"Connection": "close", 
"Content-Length": "0", 
"Host": "httpbin.org”, 
"User-Agent": "python-requests/2.4.3 Cpython/2.7.8 Windows/7", 
"Xx-Request-Id": "1l9ed80fc-ffe6-4dc0-b83a-08dba09daf88" 
}, 
"json": null, 
所 mg MILB:.1L3LL6.L60", 
noelr: REEDSXXUEEBRIR IO 和 SEE 


r1 为 data 提 供 了 值 ， 再 看 效果 : 


{ 


se 
"data": {}, 
"form™"s 4 


"keyl": "Valuel"， 
"Fey2"; "value2" 
}, 


"headers": { 
"ES AR 
"Accept-Encoding": "gzip, deflate", 
"Connection": "close"™, 
"Content-Length": "23", 
"Connent-Type": "application/x-www-form-urlencoded", 


"Host": “httpbin.org", 
"User-Agent": "python-requests/2.4.3 Cpython/2.7.8 Windows/7", 
"x-Request-Id": "b8ba897f-44c9-4922-b157-562e0cf07bcd" 

}, 

"json": null, 

GEL 8.1 4416.4160"， 

marlL"s https//httphin.org/peost" 

} 


新 闻 比 较 看 才 有 意思 ， 代 码 也 如 此 。 比 较 上 面 的 两 个 截图 ， 发 现 后 者 
当 data 被 赋值 之 后 ， 在 结 末 中 多 的 form 值 ， 束 多 了 data 所 传 入 的 值 ， 
form 的 值 就 是 post 给 服务 絮 的 内 容 。 


4.http 头 部 


>>> r.headers['content-type'] 


"applLication/json' 


主意 ， 引 号 里 面 的 内 容 不 区 分 大 小 写 “CONTENT-TYPE” 也 可 以 ， 也 能 
名 


>>> r.headers['content-type'] = "adad' 
>>> r.headers['content-type'] 


"adad ' 


注意 ， 当 定制 头 部 的 时 候 ， 如 采 需 要 定制 的 项 目 有 很 多 ， 一 般 用 到 字 
典 类 型 的 数据 。 


通过 一 个 实例 ， 展 示 第 三 方 模块 的 应 用 方法 ， 其 实 没 有 什么 特殊 的 地 
方 ， 只 要 安装 了 ， 就 和 用 标准 库 模 块 一 样 了 。 


根据 我 的 个 人 经 验 ， 第 三 方 模块 常 肖 在 某 个 方面 做 得 更 友好 ， 或 者 性 
能 更 优化 ， 所 以 ， 不 要 将 其 放 在 我 们 的 视野 之 外 。 


第 7 章 ”保存 数据 


如 果 在 程序 中 ， 有 数据 要 保存 到 磁 副 中 ， 放 到 某 个 文件 中 是 一 种 不 错 
的 方法 。 但 是 ， 要 注意 存 到 文件 中 的 数据 不 能 随意 放置 ， 因 为 你 早晚 
还 要 把 数据 读 出 来 ， 如 果 没 有 什么 规律 ， 读 出 来 的 时 候 会 很 及 烦 。 


很 多 开发 者 早 束 意 识 到 这 点 了 ， 于 是 束 出 现 了 将 要 存储 的 对 象 格式 化 
(或 者 叫 作 序 列 化 ) ， 即 按照 某 种 特定 要 求 将 对 象 存 到 文件 中 ， 才 好 
存 好 取 ， 这 有 点 类 似 集 逆 箱 的 作用 。 


7.1 pickle 


pickle 是 标准 库 中 的 一 个 模块 ， 还 有 跟 它 完全 一 样 的 叫 作 cpickle， 两 者 
的 区 别 就 是 后 者 更 快 (似乎 已 经 是 一 个 规律 了 ， 凡 是 某 个 模块 前 面 有 
c， 就 意味 着 它 是 用 c 语 言 重 写 了 ， 也 意味 着 速度 更 快 些 ) 。 所 以 ， 在 
下 面 的 操作 中 ， 不 管 是 用 import pickle， 还 是 用 import cpickle as 

pickle， 在 功能 上 都 是 一 样 的 。 


>>> import pickle 
>>> integers = [1, 2, 3, 4, 5] 


>>> f = open("22901.dat", "wb") 


>>> pickle.dump(integers, f) 


>>> f.close() 


用 pickle.dump (integers，f) 将 数据 integers 保 存 到 文件 22901.dat 中 。 
如 有 果 你 要 打开 这 个 文件 看 里 面 的 内 容 ， 可 能 会 有 点 失望 ,但 是 ， 它 对 
计算 机 是 友好 的 。 这 个 步骤 可 以 称 之 为 将 对 象 序列 化 。 用 到 的 方法 


日 
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。 obj: 序列 化 对 象 ， 在 上 面 的 例子 中 是 一 个 列表 ， 它 是 基本 类 型 ， 
也 可 以 序列 化 目 己 定义 的 类 型 。 

。file: 要 写 入 的 文件 。 可 以 更 广泛 地 理解 为 拥有 write() 方 法 的 对 
象 ， 并 且 能 接受 字符 串 为 参数 ， 所 以 ， 它 还 可 以 古 一 个 StringIO 对 
象 ， 或 者 其 他 目 定义 满足 条 件 的 对 象 。 


。 protocol: 可 选项 。 默 认为 False (或 者 说 0) ， 以 ASCII 格 式 保存 
对 象 ， 如果 设 置 为 1 或 者 True， 则 以 压缩 的 二 进 制 格式 保存 对 象 。 


换 一 种 数据 格式 ， 并 且 做 对 比 : 


>>> import pickle 

>>> d= 人 Q 

>>> integers = range(9999) 

>>> d["i"] = integers # 下 面 将 这 个 dict 格 式 的 对 象 存 入 文件 


>>> f = open("22902.dat", "wb") 


>>> pickle.dump(d, f) # 文 件 中 以 ascii 格 式 保存 数据 


>>> f.close() 


>>> f = open("22903.dat", "wb") 


>>> pickle.dump(d, f, True) # 文 件 中 以 二 进 制 格式 保存 数据 


>>> f.close() 
>>> import os 
>>> S1 = os.stat("22902.dat").st_size # 得 到 两 个 文件 的 大 小 


>>> S2 = os.stat("22903.dat").st_size 


>>> print "%d, %d, %.2f%%" % (si, s2, (s2+0.0)/s1*100) 


68903, 29774, 43.21% 


比较 结果 发 现 ， 以 二 进 制 方式 保存 的 文件 比 以 AsCII 格 式 保存 的 文件 
小 很 多 ， 前 者 约 是 后 者 的 43% 。 

所 以 ， 在 序列 化 的 时 候 ， 特 别 是 面 对 较 大 对 象 时 ， 建 议 将 dump0 的 参 
数 Tmue 设 置 上 ， 呈 然 现在 存 箭 设 备 的 价格 便宜 ， 但 是 能 省 的 还 是 省 点 
比较 好 。 


存 入 文件 ， 还 有 男 外 一 个 目标 ， 束 是 要 读 出 来 ， 也 称 之 为 肥 序列 化 。 


>>> integers = pickle.load(open("22901.dat", "rb")) 


>>> print integers 


[1, 2, 3, 4, 5] 


再 看 看 被 以 二 进 制 方式 存 入 的 那个 文件 : 


>>> f = open("22903.dat", "rb") 
>>> d = pickle.load(f) 
>>> print d 


{'i': [0, 1，2，3， 4, 5,6， 7，8，9，10，11，12，13，.... # 省 略 后 面 的 数字 } 


>>> f.close() 


如 有 果 是 目 己 定义 的 数据 类 型 ， 古 否 可 以 用 上 述 方 式 存 入 文件 并 读 出 来 
呢 ? 看 下 面 的 例子 : 


>>> import cpickle as pickle #cPickle 更 快 

>>> import StringI0 # 标 准 库 中 的 一 个 模块 ， 跟 file 功 能 类 似 ， 
# 只 不 过 是 在 内 存 中 操作 “文件 ” 

>>> class Book(object): # 自 定义 一 种 类 型 


def _ init_ (self,name): 
self.name = name 
def my_book(self): 


print "my book is: ", self.name 


>>> pybook = Book("<from beginner to master>") 
>>> pybook.my_book() 


my book is: <from beginner to master> 


>>> file = StringI0.StringIO() 


>>> pickle.dump(pybook, file, 1) 


>>> print file.getvalue() # 查 看 文件” 内容， 注意 下 面 不 是 乱码 
ccopy_reg 
_reconstructor 


q?(c_ main __ 
Book 
q?c__builtin _ 
object 


gq?NtRq?}qU?nameq?U?<from beginner to master>sb. 


>>> pickle.dump(pybook, file) # 换 一 种 方式 ， 再 看 内 容 ， 可 以 比较 一 下 
>>> print file.getvalue() # 视 觉 上 两 者 就 有 很 大 差异 
ccopy_reg 

_reconstructor 


q?(c_main_ 
Book 

gc -builtim 
object 
q?NtRq?}qU?nameq?U?<from beginner to master>sb.ccopy_reg 
_reconstructor 
p1 

(c_main_ _ 
Book 

p2 

Cc_ builtin_ _ 
object 


p3 


NtRp4 
(dp5 

S'name' 

p6 

S'<from beginner to master>' 
p7 

Sb . 


如 采 从 文件 中 读 出 来 : 


>>> file.seek(0) # 找 到 对 应 类 型 
>>> pybook2 = pickle.load(file) 

>>> pybook2.my_book() 

my book is: <from beginner to master> 


>>> file.close() 


7.2 shelve 


pickle 模 块 已 经 表现 出 它 足 够 好 的 一 面 了 。 不 过 ， 由 于 数据 的 复杂 性 ， 
pickle 只 能 完成 一 部 分 工作 ， 在 另外 更 复杂 的 情况 下 ， 它 就 稍 显 麻烦 
了 ， 于 是 ， 又 有 了 shelve。 


shelve 模 块 也 是 标准 库 中 的 ， 先 看 看 基本 的 写 、 读 操作 。 


>>> import shelve 


>>> S = shelve.open("22901.db") 

>>> s["name"] = "www.itdiffer.com" 

>>> s["lang"] = "python" 

>>> s["pages"] = 1000 

>>> s["contents"] = {"first":"base knowledge", "second":"day day up"} 


>>> s.close() 


以 上 完成 了 数据 写 入 的 过 程 ， 其 实 ， 这 很 接近 数据 库 的 样式 了 。 下 面 
是 读 。 

>>> s = shelve.open("22901.db") 

>>> name = s["name"] 

>>> print name 

www.itdiffer.com 

>>> contents = s["contents"] 

>>> print contents 


{'second': 'day day up', 'first': 'base knowledge'} 


看 到 输出 的 内 容 ， 你 一 定 想到 ， 肯 定 可 以 用 for 语 句 来 恋 ， 想 到 了 整 用 
代码 来 测试 ， 这 就 是 Python 交 互 模式 的 便利 之 处 。 


>35 TOr kK -3H 


print k, s[k] 


contents {'second': 'day day up', 'first': 'base knowledge'} 
lang python 
pages 1000 


name www.itdiffer.com 


不 管 是 写 还 是 恋 ， 都 似乎 要 人 简化 了 。 所 建立 的 对 象 ;， 就 如 同 字 上 典 一 
样 ， 可 称 之 为 类 字典 对 象 ， 所以， 可 以 如 同 操作 字典 那样 来 操作 它 。 
但 是 ， 小 心 有 坑 : 


>>> f["author"] 


['qiwsir'] 


>>> f["author"] .append("Hetz") # 试 图 增加 一 个 


>>> f["author"] # 坑 就 在 这 里 
['qiwsir'] 


>>> f.close() 


当 试图 修改 一 个 已 有 刍 的 值 时 没有 报错 ， 但 是 并 没有 修改 成 功 。 要 填 
平 这 个 卦 ， 需 要 这 样 做 : 


>>> f = shelve.open("22901.db", writeback=True) # 多 一 个 参数 True 
>>> f["author"].append("Hetz") 

>>> f["author"] # 没 有 坑 了 
['qiwsir', 'Hetz'] 


>>> f.close() 


还 用 for 循 环 一 下 : 


>>> f = shelve.open("22901.db") 
>>> for k,v in f.items(): 


Pan Rn 合生 


contents : {'second': 'day day up', 'first': 'base knowledge'} 
lang : python 

pages : 1000 

author : ['qiwsir', 'Hetz'] 


name : www.itdiffer.com 


7 ° 不 过 ， 它 还 不 是 真正 的 数据 库 ， 真 正 的 数据 库 
土 三 


7.3 ”MySQL 数据 库 

尽管 用 文件 形式 将 数据 保存 到 磁盘 ， 已 经 是 一 种 不 错 的 方式 。 但 是 ， 
人 们 还 是 发 明了 更 具有 格式 化 特点 ， 并 且 写 入 和 读 取 更 快速 便捷 的 东 
西 一 数据库 。 维 基 百 科 对 数据 库 有 比较 详细 的 说 明 . 


数据 库 指 的 是 以 一 定 方 式 储 存在 一 起 、 能 为 多 个 用 户 共 诗 、 具 有 尽 可 
能 小 的 见 余 度 、 与 应 用 程序 彼此 独立 的 数据 集合 。 


到 目前 为 止 ， 地 球 上 有 以 下 三 种 类 型 的 数据 。 


。 天 系 型 数据 库 : MySQL、Microsoft Access 、SQL Server 、 


。 非 关 系 型 数据 库 : MongoDB 、BigTable (Google) ...... 
。 键 值 数据 库 : Apache Cassandra (Facebook) 、LevelDB 
(Google) ...... 


7.3.1 _ MySQL 概况 


MySQL 是 一 个 使 用 非常 广泛 的 数据 库 ， 很 多 网 站 都 使 用 它 。 关 于 这 个 
数据 库 有 很 多 传说 ， 例 如 维基 百科 上 有 这 人 么 一 段 : 


MySQL 原 本 是 一 个 开放 源 代 人 码 的 关系 数据 库 管理 系统 ， 原 开发 者 为 瑞 
典 的 MySQL AB 人 公司， 该 公司 于 2008 年 被 太阳 微 系统 (Sun 
Microsystems) 收购 。2009 年 ， 甲 骨 文 公司 〈Oracle) 收购 太阳 微 系 统 
公司 ，MySQL 成 为 Oracle 旗 下 产品 。 


MySQL 在 过 去 由 于 性 能 高 、 成 本 低 、 可 靠 性 好 ， 已 经 成 为 最 流行 的 开 
源 数据 库 ， 因 此 被 广泛 地 应 用 在 Internet 上 的 中 小 型 网 站 中 。 随 着 
MySQL 的 不 断 成 熟 ， 也 逐渐 被 用 于 更 多 大 规模 网 站 和 应 用 ， 比 如 维基 
百科 、Google 和 Facebook 等 网 站 。 非 常 流行 的 开源 软件 组 合 LAMP 中 
的 “M” 指 的 就 是 MySQL 。 


但 被 甲骨 文公 司 收购 后 ，Oracle 大 幅 调 涨 MySQL 商 业 版 的 售 价 ， 且 甲 
骨 文 公司 不 再 文 持 另 一 个 目 由 软件 项 目 OpenSolaris 的 发 展 ， 因 此 导致 


自由 软件 社区 们 对 于 Oracle 是 否 还 会 持续 支持 MySQL 社 区 版 (MySQL 
之 中 唯一 的 免费 版 本 ) 有 所 隐忧 ， 因 此 原先 一 些 使 用 MySQL 的 开源 软 
件 了 逐渐 转 回 其 他 的 数据 库 。 例 如 维基 百科 已 于 2013 年 正式 宣布 将 从 
MySQL 迁 移 到 MariaDB 数 据 库 。 


不 管 怎样 ，MySQL 依 然 是 一 个 不 错 的 数据 库 选 择 ， 足 够 支持 读者 完成 
一 个 不 小 的 网 站 。 
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你 的 电脑 或 许 不 会 天 生 就 有 MySQL， 它 本 质 上 也 是 一 个 程序 ， 若 有 必 
要 ， 需 安装 。 


我 用 Ubuntu 操作 系统 演示 ， 因 为 我 相信 读者 将 来 在 真正 的 工程 项 目 
中 ， 多 数 情况 下 要 操作 Linux 系 统 的 服务 右 ， 并 且 ， 我 酷爱 用 Ubuntu 。 
本 书 的 目标 是 from beginner to master， 不 管 是 不 是 真 的 master， 也 要 装 
得 像 ，Linux 能 够 给 你 撑 门 面 ， 这 也 是 推荐 使 用 Ubuntu 的 原因 。 


第 一 步 ， 在 shell 端 运行 如 下 命令 


sudo apt-get install mysql-server 


运行 完毕 天 安装 好 了 这 个 数据 库 ， 有 是 不 是 很 简单 呢 ? 当然 ， 还 要 进行 


局 动 MySQL 数 据 库 ， 然 后 进行 下 面 的 操作 ， 对 其 进行 配置 。 


默认 的 MySQL 安 装 之 后 根 用 户 是 没有 密码 的 ， 注 意 ， 这 里 有 一 个 名 
词 “ 根 用 户 ”， 其 用 户 名 是 : root。 运行: 


$mysql -u root 


人 


下 面 设置 MySQL 中 的 root 用 户 密码 ， 人 否则 ，MySQL 服 务 无 安全 可 言 
了 


mysql> GRANT ALL PRIVILEGES ON *.* TO root@localhost IDENTIFIED BY "123456" 


用 123456 作 为 root 用 户 的 密码 ， 应 该 是 非常 轧 夸 的 ， 在 真正 的 项 目 中 
最 好 别 这 样 做 ， 要 用 大 小 写 子 母 与 数 子 混合 的 密码 ， 且 不 少 于 8 位 。 以 
后 如 条 再 登录 数据 库 ， 束 可 以 用 刚才 设置 的 密码 了 。 


安 逆 完 就 要 运行 它 ， 并 操作 这 个 数据 库 。 


$ mysql -u root -p 


Enter password: 


从 入 数据 库 的 密码 ， 之 后 出 
J Ee 
输 年 时 做 人) ， 百出 现 : 
Welcome to the MySQL monitor. Commands end with ; or \g. 
Your MySQL connection id is 373 
Server version: 5.5.38-Qubuntu0.14.04.1 (Ubuntu) 
Copyright (c) 2000, 2014, Oracle and/or its affiliates. All rights reserved. 
Oracle is a registered trademark of Oracle Corporation and/or its 
affiliates. Other names may be trademarks of their respective 
owners . 


Type 'help;' or '\h' for help. Type '\c' to clear the current input statement. 


mysql> 


茶 喜 你 ， 已 经 进入 到 数据 操作 界面 了 ， 接 下 来 整 可 以 对 这 个 数据 进行 
操作 了 。 例 如 : 


mysql> Show databases; 


| information_schema | 


于 


“show databases;”( 最 后 的 半角 分 号 别 忘 记 了 ) 命令 表示 列 出 当前 已 经 
有 的 数据 库 。 


对 数据 库 的 操作 ， 除 了 用 命令 之 外 ， 还 可 以 使 用 一 些 可 视 化 工具 ， 比 
如 phpmyadmin 就 是 不 错 的 。 


更 多 数据 库 操作 的 知识 ， 这 里 束 不 再 介绍 了 ， 读 者 可 以 参考 有 天书 
籍 。 


MySQL 数 据 库 已 经 安装 好 ， 但 是 Python 还 不 能 操作 它 ， 还 要 继续 安装 
Python 操作 数据 库 的 模块 一 python-MySQLdb 


7.3.4 安装 python-MySQLdb 


python-MySQLdb 是 一 个 接口 程序 ，Python 通 过 它 对 MySQL 数 据 实现 各 
种 操作 。 


在 编程 中 会 遇 到 很 多 类 似 的 接口 程序 ， 通 过 接口 程序 对 另外 一 个 对 象 
进行 操作 。 接 口 程序 就 好 比 钥 吓 ， 如 采 要 开锁 ， 直 接 用 手指 去 捅 肯定 
古 不 行 的 ， 必 须 借助 工具 插入 到 锁 孔 中 ， 把 锁 打 开 ，1] 开 了 ， 束 可 以 
操作 [ 门 里 面 的 东西 了 ， 那 么 打开 锁 的 工具 就 古 接 口 程序 。 谁 都 知道 ， 
用 对 应 的 钥 是 开锁 是 最 好 的 ， 如 有 果 用 别 的 工具 《比如 锤子 ) 或 许 不 便 
利 (当然 具有 特殊 开锁 能 力 的 人 除外 ) ， 也 就 是 接口 程序 ， 编 码 水 
平等 都 是 考虑 因素 。 


python-MySQLdb 瓯 是 打开 MySQL 数 据 库 的 钥匙 。 


如 果 要 源码 安 疾 ， 其 源码 下 载 地 址 : 
https:/pypi.python.org/pypiMySQL-python/。 下 载 之 后 就 可 以 安装 了 。 


在 Ubuntu 操作 系统 下 还 可 以 用 软件 仓库 来 安装 。 


sudo apt-get install build-essential python-dev libmysqlclient-dev 


sudo apt-get install python-MySQLdb 


也 可 以 用 pip 来 安装 : 


pip install mysql-python 


安装 之 后 ， 在 Python 交 互 模式 下 : 


>>> import MySQLdb 


如 条 不 报错 ， 那 么 恭喜 你 ， 已 经 安 闭 好 了 “。 如 有 果 报 错 ， 那 么 恭喜 你 ， 


可 以 借 着 错误 信息 提高 目 己 的 计算 机 水 平 。 
7.3.5 ”连接 数据 库 
连接 数据 库 之 前 要 先 建立 数据 库 。 


$ mysql -u root -p 


Enter password: 


进入 到 数据 库 操作 界 面 : 


mysql> 


输入 如 下 命令 ， 建 立 一 个 数据 库 : 


mysql> create database qiwsirtest character set utf8; 


Query OK, 1 row affected (0.00 sec) 


注意 上 面 的 指令 ， 如 果 仅 仅 输入 create database qiwsirtest 也 可 以 ， 但 是 
我 在 后 面 增加 了 character set utf8， 意 思 是 所 建立 的 数据 库 qiwsirtest， 


编码 是 utf-8， 这 样 存 入 汉字 束 不 十 乱码 了 。 


看 到 那 一 行 提示 : Query OK，1 row affected (0.00 sec) ， 说 明 这 个 数 


据 库 已 经 建立 好 了 ， 名 字 叫 作 giwsirtest 


数据 库 建 立 之 后 ， 就 可 以 用 Python 通过 已 经 安装 的 python-MySQLdb 来 


连接 这 个 名 字 叫 作 qiwsirtest 的 库 了 。 


>>> import MySQLdb 


conn = MySQLdb.connect(host="localhost", user="root", passwd="123123", db="qiwsirtest", port=3306, charset="utf8") 


下 面 逐 个 解释 上 述 命令 的 含义 。 


注 : 


host: 等 号 的 后 面 应 该 填写 MySQL 数 据 库 的 地 址 ， 因 为 数据 库 残 
在 本 机 上 ， 所 以 使 用 localhost， 注 意 引号 。 如 果 在 其 他 的 服务 器 
上 ， 这 里 应 该 填写 耳 地 址 。 一 般 中 小 型 的 网 站 ， 数 据 库 和 程序 都 
是 在 同一 台 服 务 器 (计算 机 ) 上 ， 就 使 用 localhost 了 。 

user: 登录 数据 库 的 用 户 名 ， 这 里 一 般 填 写 “root*， 还 是 要 注意 引 
号 。 当 然 ， 如 果 读 者 命名 了 别 的 用 户 名 ， 束 更 改 为 相应 用 户 。 但 
是 ， 不 同 用 户 的 权限 可 能 不 同 ， 所 以 ， 在 程序 中 ， 如 果 要 操作 数 
据 库 ， 还 要 注意 所 拥有 的 权限 。 在 这 里 用 root， 束 什么 权限 都 有 
了 。 不 过 ， 这 种 做 法 在 大 型 系统 中 是 应 该 避免 的 。 

passwd: user 账 户 登录 MySQL 的 密码 。 例 子 中 用 的 密码 

是 “123123”， 不 要 起 记 引 号 。 

db: 束 是 刚刚 通 create 命 令 建立 的 数据 库 ， 数 据 库 名 字 

是 “qiwsirtest”， 还 是 要 注意 引号 。 如 果 你 建立 的 数据 库 名 字 不 是 
这 个 ， 就 写 自己 所 建 数据 库 的 名 字 。 

port: 一 般 情况 ，MySQL 的 默认 端口 是 3306。 当 MySQL 被 安装 到 
服务 器 之 后 ， 为 了 能 够 允许 网 络 访问 ， 服 务 器 (计算 机 ) 要 提供 
一 个 访问 端口 给 它 (服务 器 管理 员 可 以 进行 配置 端口 ) 。 
charset: 这 个 设置 ， 在 很 多 教程 中 都 不 写 ， 结 果 在 真正 进行 数据 
存储 的 时 候 ， 发 现 有 乱码 。 这 里 将 qiwsirtest 这 个 数据 库 的 编码 设 
置 为 utf-8 格 式 ， 这 样 就 允许 存 入 汉字 而 无 乱 友 了。 注意， 在 
MySQL 设 置 中 ，utf-8 写 成 utf8， 没 有 中 间 的 横 线 ， 但 是 在 Python 
文件 开头 和 其 他 地 方 设置 编码 格式 的 时 候 要 写成 utf-8 。 


connect 中 的 所 有 参数 ， 可 以 只 按照 顺序 把 值 写 入 。 但 是 ， 我 推荐 


读者 的 写法 还 是 上 面 的 方式 ， 以 免 出 了 乱 子 自己 还 糊涂 。 
其 实 ， 关 于 connect 的 参数 还 有 别 的 ， 读 者 可 以 到 MySQLdb 官 方 查看 文 


全 


此 处 束 不 再 资 述 。 特 别提 醒 ， 守 方 文档 是 最 好 的 教材 ， 最 值得 反 


复 阅 读 。 
至 此 ， 已 经 完成 了 数据 库 的 连接 。 
7.3.6 “数据库 表 


就 数据 库 而 言 ， 连 接 之 后 就 要 对 其 操作 。 但 是 ， 目 前 名 字 叫 作 
giwsirtest 的 数据 库 仅 仅 是 空 架 子 ， 没 有 什么 可 操作 的 ， 要 操作 它 ， 就 
必须 在 里 面 建立 “ 表 ”， 什 么 是 数据 库 的 表 呢 ? 下面 摘抄 维基 百科 对 数 
据 库 表 的 简要 解释 。 


在 关系 数据 库 中 ， 数 据 库 表 是 一 系列 二 维 数组 的 集合 ， 用 来 代表 和 储 
存 数 据 对 象 之 间 的 关系 。 它 由 纵 癌 的 列 和 横 回 的 行 组 成 ， 例 如 一 个 有 
天 作者 信息 的 名 为 authors 的 表 中 ， 每 个 列 包含 的 是 所 有 作者 的 某 个 特 
定 类 型 的 信息 ， 比 如 “姓氏 ”， 而 每 行 则 包含 了 某 个 特定 作者 的 所 有 信 
轧 : 姓 、 名 、 住 址 等 。 


对 于 特定 的 数据 库 表 ， 列 的 数目 一 般 事 先 固定 ， 各 列 之 间 可 以 由 列 名 
来 识别 。 而 行 的 数目 可 以 随时 动态 变化 ， 通 弟 每 行者 可 以 根据 某 个 
(或 蘑 几 个 ) 列 中 的 数据 来 识别 ， 称 为 候选 键 。 


在 qiwsirtest 中 建立 一 个 存储 用 户 名 、 用 户 密 码 、 用 户 邮 箱 的 表 ， 其 结 
构 用 二 维 表 格 表 现 如 下 : 


寺 别 说 明 ， 这 里 为 了 位 化 细 市 、 突 出 重点 ， 对 密码 不 加 密 ， 直 接 明 文 
保存 ， 里 然 这 种 方式 是 很 不 安全 的 。 据 小 道 消 恩 ， 有 的 网 站 居然 用 明 
文 你 存 窗 码 ， 这 么 做 的 目的 是 比较 可 恶 的 。 束 让 我 在 这 里 ， 仅 仅 在 这 
里 可 恶 一 次 。 


因为 直接 操作 数据 不 是 本 书 重点 ， 但 是 关联 到 后 面 的 操作 ， 为 了 让 读 
者 在 阅读 上 连贯 ， 快 速 地 说 明 建立 数据 库 表 并 输入 内 容 。 


Empty set (0.00 sec) 


用 show tables 命 令 显 示 这 个 数据 库 中 是 否 有 数据 表 】， 坦 询 结 采 显示 


六 
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用 如 下 命令 建立 一 个 数据 表 ， 这 个 数据 表 的 内 容 束 是 上 面 所 说 明 的 。 


mysdql>create table users(id int(2) not null Primary key 
auto_increment,username varchar(40),password text,email text)default 
charset=utf8; 


Query OK, © rows affected (0.12 sec) 


建立 的 这 个 数据 表 名 称 是 : users， 其 中 包含 上 述 字段 ， 可 以 用 下 面 的 
方式 看 一 看 这 个 数据 表 的 结构 。 


mysql> show tables; 


1 row in set (8.66 sec) 


查询 显示 ， 在 qiwsirtest 这 个 数据 库 中 已 经 有 一 个 表 ， 它 的 名 字 是 : 
Users。 


mysql> desc users; 


+---------- +------------- +------ +----- +--------- +---------------- - 
Field Type | Null | Key | Default | Extra 
+---------- +------------- +------ +----- +--------- +---------------- 一 
id int(2) | NO | PRI | NULL | auto increment | 
username | varchar(46) | YES | | NULL 
password | text | YES | | NULL 
email text | YES | | NULL 
+---------- +------------- +------ +----- +--------- +---------------- - 


4 rows in set (868.860 sec) 


显示 出 来 表 users 的 结构 。 


特别 提醒 : 上 述 所 有 字段 设置 仅 为 演示 ， 在 实际 开发 中 ， 要 根据 具体 
情况 来 确定 字段 的 属性 。 


如 此 束 得 到 了 一 个 空 表 ， 可 以 查询 看 看 : 


mysql> select * from users; 


Empty set (0.01 sec) 


癌 里 面 插入 一 条 信息 : 


mysql> insert into users(username,password,email) 
values("qiw "123123", "qiwsir@gmail.com"); 
Query OK, 1 row affected (0.05 sec) 


mysql> select * from users; 


| id | username | password | email | 
+----+---------- +---------- +------------------ 一 
| 1 | giwsir | 123123 | qiwsir@email.com | 
+----+---------- +---------- 二 ------------------ 一 
1 row in set (608.88 sec) 


这 样 吏 得 到 了 一 个 有 内 容 的 数据 库 表 。 
7.3.7 ”操作 数据 库 
连接 数据 库 。 


>>> import MySQLdb 


onn = MySQLdb.connect(host="localhost",user="root",passwd="123123", db= "qiwsirtest",charset="utf8") 


Python 建 并 了 与 数据 的 连接 ， 其 实 是 建立 了 一 个 MySQLdb.connect() 的 
实例 对 象 ， 或 者 泛 泛 地 称 之 为 连接 对 象 ，Python 束 是 通过 连接 对 象 和 
数据 库 对 话 。 这 个 对 象 常用 的 方法 如 下 。 


。 commit(): 如 果 数 据 库 表 进 行 了 修改 ， 提 交 保 存 当 前 的 数据 。 当 
然 ， 如 果 此 用 户 没 有 权限 就 作罢 ， 什 么 也 不 会 发 生 。 

。 rollback(): 如 果 有 权限 ， 就 取消 当前 的 操作 ， 否 则 报错 。 

。 cursor ([cursorclass]) : 返回 连接 的 游标 对 象 。 通 过 游标 执行 SQL 
0 查 结果 。 游 标 比 连接 支持 更 多 的 方法 ， 而 且 可 能 在 程序 

。 close(): 关闭 连接 。 此 后 ， 连 接 对 象 和 游标 都 不 再 可 用 了 。 


Python 和 数据 之 间 的 连接 建立 起 来 之 后 ， 者 要 操作 数据 库 ， 就 需要 让 
Python 对 数据 库 执 行 SQL 语句 。 


Python 是 通过 游标 执行 SQL 语 名 的， 所以， 连接 建 立 之 后 ， 束 要 利用 
连接 对 象 得 到 游标 对 象 ， 方 法 如 下 : 


>>> cur = conn.cursor() 


此 后 ， 束 可 以 利用 游标 对 和 象 的 方法 对 数据 库 进行 操作 ， 那 么 还 得 了 解 
游标 对 象 的 常用 方法 ， 如 表 7-1 所 示 。 


表 7-1 游标 对 象 的 常用 方法 


close() 关闭 游标 
execute(query[.args]) 执行 一 条 SQL 语句 ， 可 以 带 参数 


executemany(query. pseq) 对 序列 pseq 中 的 每 个 参数 执行 sql 语句 
fetchone() 返回 一 条 查询 结果 
fetchall0 返回 所 有 查询 结果 


fetchmany([size]) 返回 size 条 结果 


nextset() 移动 到 下 一 个 结果 
移动 游标 到 指定 行 ，mode='relative'"， 表 示 从 当前 行 开 始 移动 value 条 ; mode='absolute'， 表 
示 从 第 一 行 开始 移动 value 条 


scroll(value,mode='relative') 


1. 插 入 


例如 ， 要 在 数据 表 users 中 插入 一 条 记录 ， 使 得 : username="python"， 
password="123456"，email="python@gmail.com"， 这 样 做 : 


>>> cur.execute("insert into users (username,password,email) values (%s,%s,%s)", ("python","123456","python@gmail.com" 
)) 


iL 


没有 报错 ， 并 且 返 回 一 个 "1L" 结 果 ， 说 明 有 一 行 记录 操作 成 功 。 不 妨 
I 式 查 看 (读者 可 以 在 男 外 一 个 shell 中 进行 操 


mysql> select * from users; 


+----+---------- +---------- +------------------ 一 
| id | username | password | email | 
+----+---------- +---------- +------------------ 一 
| 1 | qiwsir | 123123 | qiwsir@email.com | 
+----+---------- +---------- +------------------ 一 


1 row in set (9.686 sec) 


怎么 没有 看 到 增加 的 那 一 条 呢 ? 哪里 错 了 ? 上 面 也 没有 报错 。 


特别 注意 ， 通过 “cur.execute()” 对 数据 库 进行 操作 之 后 ， 没 有 报错 ， 完 

全 正确 ， 但 是 不 等 于 数据 就 已 经 提交 到 数据 库 中 了 ， 还 必须 要 用 

到 “MySQLdb.connect” 的 一 个 属性 : commit0， 将 数据 提交 上 去 ， 也 束 

人 ， 必 须要 将 数据 提交 才能 有 效 改变 数 
车 oO 


>>> conn.commit() 


再 到 “mysgl>” 中 运行 “select*from users” 试 一 试 : 


mysql> select * from users; 


+----+---------- +---------- +------------------ - 
| id | username | password | email | 
+----+---------- +---------- +------------------ 一 
| 1 | qiwsir | 123123 | qiwsir@email.com | 
| 2 | python | 123456 | pythonQ@gmail.com | 
+----+---------- +---------- +------------------ 一 
2 rows in set (6.96 sec) 


琳 然 如 此 。 


这 就 如 同 编写 一 个 文本 一 样 ， 将 文字 写 到 文本 上 ， 并 不 等 于 文字 已 经 
你 留 在 文本 文件 中 了 ， 必 须 执行 “CTRL-S” 才 能 保存 。 所 有 

以 “execute()” 执 行 的 各 种 sql 语 句 之 后 ， 要 计 已 经 执行 的 效果 保存 ， 都 
必须 运行 连接 对 象 的 “commit()” 方 法 。 


再 尝试 一 下 插入 多 条 的 那个 命令 “executemany (query，args) ”。 


>>> Cur ee insert into users a pe email) values (%s,%s %s)", 

CE a "111222", "g@gmail.com"), ("facebook", "222333", "f@face.book"),(" ‘github", "333444" , "git@hub.com"), 
("docker", "444555" "doc@ker. com"))) 

4L 


>>> conn.commit() 


到 “mysql>” 里 面 看 结果 : 


mysql> select * from users; 


+----+---------- +---------- +------------------ 
| id | username | password | email | 
了 ----+---------- +---------- +------------------ 一 
| 1 | qiwsir | 123123 | qiwsir@egmail.com | 
| 2 | python | 123456 | python@gmail .com | 
| 3 | google | 222 | g@gmail .com | 
| 4 | facebook | 222333 | f@face.book | 
| 5 | github | 333444 | git@hub .com | 
| 6 | docker | 444555 | doc@ker .com | 
+----+---------- +---------- +------------------ 十 


6 rows in set (8.88 sec) 


成 功 插 入 了 多 条 记录 。 在 “executemany (query,， pseq) ， Be query 还 
是 一 条 sq] 语 句 ， 0 六 元 组 ， 特 别 注意 一 环 
套 一 环 的 括号 ， 这 个 元 组 里 面 的 元 素 也 是 元 组 ， 每 个 元 组 分 别 对 应 sql 
语 各 中 的 字段 济 表 了 


除了 插入 命令 ， 其 他 对 数据 操作 的 命令 都 可 以 用 类 似 上 面 的 方式 ， 比 
如 删除 、 修 改 等 。 


2. 查 询 
如 果 要 从 数据 库 中 查询 数据 ， 也 用 游标 方法 来 操作 。 


>>> cur.execute("select * from users") 


7L 


说 明 从 users 表 汇总 查询 出 来 了 7 条 记录 。 但 是 ， 这 似乎 有 点 不 友好 ，7 
条 记录 在 哪里 呢 ? 如果 在 “mysql>” 下 操作 查询 命令 ， 一 下 子 束 把 7 条 记 


孙 列 出 来 了 ， 在 这 里 怎么 显示 Python 的 查询 结果 呢 ? 


要 用 到 游标 对 象 的 fetchall0、fetchmany (size=None) 、fetchone()、 
scroll (value，mode='relative') 等 方法 。 


>>> cur.execute("select * from users") 
Tt 


>>> lines = cur.fetchall() 


至 此 已 经 将 查询 到 的 记录 赋值 给 变量 lines 了 ， 如 采 要 把 它们 显示 出 
来 ， 就 要 用 到 曾经 学 习 过 的 循环 语句 。 


>>> for line in lines: 


print line 


(1L, u'gqiwsir', u'123123', u'qiwsir@gmail.com') 


一 


2L, u'python', u'123456', u'python@gmail.com') 
(3L, u'google', u'111222', u'gQ@gmail.com') 


(4L, u'facebook', u'222333', u'f@face.book') 


一 


5L, u'github', u'333444', u'git@hub.com') 


(6L, u'docker', u'444555', u'doc@ker.com') 


一 


7L, U'\u8001\u9f50', uU'9988', u'qiwsir@gmail.com') 


很 好 ， 果 然 逐 条 显示 出 来 了 " 请 读者 注意 ， 第 七 条 中 的 
uNu800lu95f5'， 在 这 里 是 汉字 ， 只 是 由 于 我 的 shell 不 能 显示 罢了 ， 不 
必 惊 慑 ， 也 不 必 搭 理 它 。 


只 想 碍 出 第 一 条 ， 可 以 吗 ? 当然 可 以 ， 再 看 下 面 : 


>>> cur.execute("select * from users where id=1") 


4 


>>> line_first = cur.fetchone() # 只 返回 一 条 


>>> print line_first 


(1L，u'qiwsir'，UuU'123123'，U'qiwsir@gmail.com') 


为 了 对 上 述 过 程 了 解 深 入 ， 做 下 面 的 实验 : 


>>> cur.execute("select * from users") 

入 bs 

>>> print cur.fetchall() 

((1L, u'qiwsir', u'123123', u'gqiwsir@gmail.com'), (2L, u'python', u'123456', u'python@gmail.com'), (3L, u'google', u'1 


11222', u'gQ@gmail.com'), (4L, u'facebook', u'222333', u'f@face.book'), (5L, u'github', u'333444', u'git@hub.com'), (6L 
, U'docker', u'444555', u'doc@ker.com'), (7L, u'\u8001\u9f50', u'9988', u'qiwsir@gmail.com')) 


原来 ， 用 curexecute0 从 数据 库 查 询 出 来 的 东西 ， 被 “保存 在 了 cur 所 能 
找到 的 某 个 地 方 "”” 要 找 出 这 些 被 保存 的 东西 ， 需 要 用 cur.fetchall() 
(或 者 fechone 等 ) ， 并 且 找 出 来 之 后 ， 作 为 对 象 存 在 。 从 上 面 的 实验 
探讨 发 现 ， 返 回 值 是 一 个 元 组 对 象 ， 里 面 的 每 个 元 素 ， 又 是 一 个 一 个 
的 元 组 对 象 ， 因 此 ， 用 for 循 环 就 可 以 一 个 一 个 拿 出 来 了 。 


接 看 上 面 的 操作 ， 再 打印 一 过 。 


>>> print cur.fetchall() 


() 


怎么 是 空 ? 不 是 说 作为 对 象 已 经 存在 于 内 存 中 了 吗 ? 难道 这 个 内 存 中 
的 对 象 仅 一 次 有 效 吗 ? 

不 要 着 急 ， 这 就 是 神奇 所 在 。 

通过 游标 找 出 来 的 对 象 ， 在 读 取 的 时 候 有 一 个 特点 ， 就 是 那个 游标 会 
移动 。 在 第 一 次 操作 了 print curfetchallO 后 ， 因 为 是 将 所 有 的 都 打印 出 
来 ， 游 标 就 从 第 一 条 移动 到 最 后 一 条 。 当 print 结 束 之 后 ， 游 标 已 经 在 
最 后 一 条 的 后 面 了 。 接 下 来 如 果 再 次 打印 ， 就 空 了 ， 最 后 一 条 后 面 没 


东 


下 面 还 要 进行 实验 ， 检 验 上 面 所 说 : 


cur.execute('select * from users') 
7L 
>>> print cur.fetchone() 
(1L, u'qiwsir', u'123123', Uu'qiwsir@gmail.com') 
>>> print cur.fetchone() 
(2L, u'python', u'123456', u'python@gmail.com') 
>>> print cur.fetchone() 


(3L, u'google', u'111222', u'gQ@gmail.com') 


这 次 不 再 一 次 性 全 部 打印 出 来 了 ， 而 是 每 次 打印 一 条 ， 从 结 采 中 可 以 
看 出 来 ， 那 个 游标 果然 在 一 条 一 条 癌 下 移动 呢 。 注 意 ， 在 这 次 实验 中 
重新 运行 了 查询 语句 。 


那么 ， 既 然 操 作 存 储 在 内 存 中 的 对 象 时 游标 会 移动 ， 能 不 能 让 游标 辐 
上 移动 ， 或 者 移动 到 指定 位 置 昵 ?这 就 是 scroll()。 


>>> print cur.fetchone() 

(5L, u'github', u'333444', u'git@hub.com') 
>>> cur.scroll(-2) 

>>> print cur.fetchone() 


(4L, u'facebook', u'222333', u'f@face.book') 


果然 ， 这 个 函数 能 够 移动 游标 ， 请 仔细 观察 ， 上 面 的 方式 是 让 游标 相 
对 于 当前 位 置 和 同上 或 者 向 下 移动 。 即 curscroll (n) 或 者 cur.scroll 
(n，"relative") ， 意 思 是 相对 于 当前 位 置 同 上 或 者 癌 下 移动 ， 若 n 为 
正 数 ， 则 表示 向 下 (向 前 ) ， 若 n 为 负数 ， 则 表示 同上 ( 同 后 ) 


还 有 一 种 方式 可 以 实现 “绝对 ”移动 ， 而 不 是 “相对 ”移动 :增加 一 个 参 
数 "absolute"。 


但 在 Python 中 ， 序 列 对 象 的 顺序 是 从 0 开始 的 。 


可 到 序号 是 2， 但 指向 第 三 条 


>>> print cur.fetchone() # 打 印 ， 果 然 是 


六 


>>> cur.scroll(2, "absolute") 


(3L, u'google', u'111222', u'gQ@gmail.com') 


>>> cur.scroll(1, "absolute") 
>>> print cur.fetchone() 


(2L, u'python', u'123456', u'python@gmail.com') 


六 


可 到 序号 是 9, 即 指向 第 一 条 


>>> cur.scroll(0, "absolute") 


>>> print cur.fetchone() 


(1L, u'gqiwsir', u'123123', Uu'qiwsir@gmail.com') 


至 此 ， 已 经 熟悉 了 curfetchal0 和 curfetchoneO 以 及 curscrol0 的 几 个 方 
法 ， 还 有 一 个 方法 ， 即 游标 在 序号 是 1 的 位 置 ， 指 向 第 二 条 。 


>>> cur.fetchmany(3) 


NS u'python', u'123456', u'python@gmail.com'), (3L, u'google', uy'111222', u'g@gmail.com'), (4L, u'facebook', u'2223 
, Uu'f@face. book， jh 


上 面 这 个 操作 ， 惑 是 实现 了 从 当前 位 置 (游标 指向 tuple 序 号 为 1 的 位 
置 ， 即 第 二 条 记录 ) 开始 ， 合 当前 位 置 ， 向 下 列 出 3 条 记录 。 


读 取 数据 ， 好 像 有 点 哆 咏 ， 但 细 细 琢 请 ， 还 是 有 道理 的 。 


Python 已 是 能 够 为 我 们 着 想 的 ， 在 连接 对 象 的 洲 标 方法 中 提供 了 一 个 
参数 ， 可 以 实现 将 读 取 到 的 数据 变 成 字典 形式 ， 这 样 殉 提 供 了 夯 外 一 
种 读 取 方 式 。 


>>> cur = conn.cursor(cursorclass=MySQLdb.cursors.DictCursor) 
>>> cur.execute("select * from users") 
At 


>>> cur.fetchall() 


({'username': U a 'password': u'123123', 'id': 1L, 'email': U sr Oa com'}, {' Username ， U "mypython', "pa 

SSwWord 2 U'123456' rid' : 2L, 'email': U rolegnail， com'}, {' username' u'go ogle ， ;password : u' 111 222 "id": 3L; 

‘Email U !g@gmail. com'}, RN U “facebook JpasSword 。 U 1222333， id: HE; ma 二 上 U ‘Tf@face. book， }, {'usern 

ame': U ‘github', 'password': u'333444', 'id': 5L, ‘email’ U ui Com' 3 username' U "docker' / "password': u'4445 
6', 1! 


id': 6L., ‘em ail': u'doc@ker.com'}, {'username': U '\u8001\u9f50' 'password': u 19988， ,， "id': 7L, "email': u'qiwsi 
a com '3) 


这 样 ， 在 元 组 里 面 的 元 素 就 古 一 个 一 个 字典 : 


>>> cur.scroll(0, "absolute") 
>>> for line in cur.fetchall(): 


print line["username"] 


qiwsir 
mypython 
google 
facebook 
github 


根据 字典 对 象 的 特点 来 读 取 “ 键 - 值 ”。 
7.3.8 ”更 新 数据 


熟悉 了 前 面 的 操作 ， 再 到 这 里 一 切 都 显得 那么 简单 。 但 仍 要 提醒 的 
是 ， 如 果 更 新 完毕 ， 和 插入 数据 一 样 ， 都 需要 commit() 来 提交 保存 。 


>>> CUr .execute("update users set username=%s where id=2", ("mypython")) 
了 上 

>>> cur.execute("select * from users where id=2") 

1 

>>> cur.fetchone() 


(2L, u'mypython', u'123456', u'python@gmail.com') 


从 操作 中 可 以 看 出 ， 已 经 将 数据 库 中 第 二 条 的 用 户 名 修改 为 mypython 
了 ， 用 的 就 是 update 语 句 。 


要 真 的 实现 在 数据 库 中 的 更 新 ， 还 要 运行 : 


>>> conn.commit() 


还 有 个 小 尾巴 ， 即 当 你 操作 数据 完毕 ， 不 要 环 记 关门 : 


>>> cur.close() 


门 锁 好 了 ， 放 心 离开 。 

7.4 MongoDB 数 据 库 

MongoDB 开 始 火 了 ， 这 是 时 代 发 展 的 需要 。 为 此 ， 在 这 里 也 探讨 一 下 
如 何 用 Python 来 操作 此 数据 库 。 考 虑 到 读者 对 这 种 数据 库 的 了 解 可 能 
比 关系 型 数据 库 陌 生 ， 所 以 ， 要 用 多 一 点 的 篇 幅 来 介绍 。 
mongodb 是 属于 NoSql 的 。 

NoSql (Not Only Sql) 指 的 是 非 关 系 型 的 数据 库 。 它 是 为 了 大 规模 
Web 应 用 而 生 的 ， 其 特征 诸如 模式 目 由 、 文 持 简 易 复 制 、 人 简单 的 API、 
大 容量 数据 等 。 


MongoDB 是 NoSql 之 一 ， 选 择 它 ， 主 要 是 因为 我 喜欢 ， 下 面 说 说 它 的 
特点 : 


。 面向 文档 存储 

。 对 任何 属性 可 索引 

。 复 制 和 高 可 用 性 

。 自动 分 片 

。 丰富 的 查询 

。 人 快速 就 地 更 新 

基于 它 的 特点 ， 擅 长 的 领域 在 于 : 
。 大 数据 ( 太 时 看 了 ! 以 下 都 可 以 不 看 ， 有 这 人 么 一 条 就 足够 了 ) 
。 内 容 管理 和 交付 
。 移动 和 社交 基础 设施 
。 用户 数据 管理 
。 数据 平台 

7.4.1 安装 MongoDB 


完 演示 在 Ubuntu 系 统 中 的 安装 过 程 : 


sudo apt-key adv --keyserver hkp://keyse r.ubuntu.com:80 --recv 7FQOCEB10 


echo 'deb hep Cn nloads-di ongodb.o org/r epo/ubuntu 
upstart di | sudo te 9 tc c/a apt/so .list.d/mongodb.1ist 


sudo apt-get update 


sudo apt-get install mongodb-10gen 


如 此 束 安 装 完 了 。 安 装 流 程 可 以 参考 : 


http://docs.mongodb.org/manual/tutorial/install-mongodb-on-ubuntu/° 


如 果 你 用 的 是 其 他 操作 系统 ， 可 以 到 官方 网 站 下 载 安 效 程 序 : 
http://www.mongodb.org/downloads， 该 网 站 能 满足 各 种 操作 系统 。 


如 果 在 安装 过 程 中 遇 到 了 问题 ， 建 议 去 问 Google 大 神 (如 果 有 读者 心 
存疑 虑 或 者 愤愤 不 平 ， 请 不 要 发 怒 ， 这 是 我 的 个 人 建议 ， 不 同意 可 以 
略 过 ， 我 当然 也 得 重读 者 的 个 人 选择 ) 。 


7.4.2 局 动 
安装 完毕 束 可 以 启动 数据 库 了 。 因 为 本 书 不 是 专门 讲 数据 库 的 ， 所 以 


这 里 不 涉及 数据 库 的 详细 讲解 ， 下 面 只 是 建立 一 个 人 简单 的 库 ， 并 且说 
明 MongoDB 和 基本 要 所 ， 目的 在 于 为 后 面 用 Python 来 操作 它 做 个 铺 


执行 mongo 启 动 shell， 显 示 的 也 是 “>”， 有 点 类 似 mysql 的 状态 。 在 shell 
中 ， 可 以 实现 与 数据 库 的 交互 操作 。 


在 shell 中 ， 有 一 个 全 局 变量 db， 使 用 哪个 数据 库 ， 哪 个 数据 库 束 会 被 
复制 给 这 个 全 局 变量 db， 如 来 那个 数据 库 不 存在 ， 束 会 新 建 。 


se mydb 


switched to db mydb 
> db 


mydb 


除非 回 这 个 数据 库 中 增加 实质 性 的 内 容 ， 否 则 它 征 看 不 到 的 。 


> Show dbs; 


local 0.03125GB 


向 这 个 数据 库 增 加 点 东西 。MongoDB 的 基本 单元 是 文档 ， 所 谓 文档 ， 
类 似 于 Python 中 的 字典 ， 以 键 值 对 的 方式 保存 数据 。 


> book = {"title":"from beginner to master", "author":"qiwsir", "lang":"python"} 


title" from beg t t 
uthor qiwsir" 
"lang" : "python" 


} 
> db.books.insert(book) 
> db.books.find() 


{ "_id" : ObjectId("554foe3cf579bc9767db9edf")， "title" : "from beginner to master", "author" : "qiwsir", "lang" : "py 
thon" } 


db 指 回 了 数据 库 mydb ，books 是 这 个 数据 库 里 面 的 一 个 集合 (类 似 
mysql 里 面 的 表 ) ， 问 集合 books 里 面 插入 了 一 个 文档 (文档 对 应 mysql 
里 面 的 记录 ) 。 “数据 库 、 集 合 、 文档 ”构成 了 mongodb 数 据 库 。 


从 上 面 的 操作 还 发 现 一 个 有 意思 的 地 方 ， 并 没有 类 似 create 之 类 的 命 
令 ， 用 到 数据 库 ， 束 通过 use xxx 操 作 ， 如 末 不 存在 就 建立， 用 到 集 
合 ， 吏 通过 db.xxx 来 使 用 ， 如 果 没 有 吏 建 立 。 可 以 总 结 为 “ 随 用 随 取 随 
建立 ”。 有 是 不 是 简单 的 有 点 出 人 意料 ? 


> Show dbs 


local 0.03125GB 


mydb 0.0625GB 


当 有 了 充实 内 容 之 后 ， 会 看 到 刚才 用 到 的 数据 库 mydb 。 


在 shell 中 ， 可 以 对 数据 施 以 “增删 改 查 ”等 操作 。 但 是 ， 我 们 的 目的 是 
用 Python 来 操作 ， 所 以 ， 还 是 把 力气 放 在 后 面 用 。 


7.4.3 ”安装 pymongo 


雪 用 Python 来 驱动 MongoDB， 必须 要 安装 驱动 模块 ， 即 pymongo， 这 
跟 操作 mysql 类 似 。 安 装 方法 推荐 如 下 : 


$ sudo pip install pymongo 


如 果 顺 利 ， 束 会 看 到 最 后 的 提示 : 


Success fully installed pymongo 


Cleaning up... 


在 写本 书 的 时 候 ， 安 疹 版 本 号 如 下 ， 如 采访 着 的 版 本 不 一 样 ， 也 无 大 
fae 


>>> pymongo.version 


"3.0.1" 


如 果 读 者 要 指定 版 本 ， 比 如 安装 2.8 版 本 的 ， 可 以 : 


$ sudo pip install pymongo==2.8 


安装 好 之 后 ， 进 入 到 Python 的 交互 模式 : 


说 明 模块 没有 问题 。 
7.4.4 连接 MongoDB 


既然 Python 驱动 MongDB 的 模块 pymongo 业 已 安装 完毕 ， 接 下 来 就 是 连 
接 ， 即 建立 连接 对 象 。 


>>> pymongo.Connection("localhost",27017) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


AttributeError: "module' object has no attribute 'Connection' 


报错 ! 文本 书 之 前 做 项 目 时 ， 束 是 按照 上 面 的 方法 链接 的 ， 读 
者 可 以 得 一 下 ， 会 发 现 很 多 教程 都 是 这 么 连接 的 。 但 和 是， 眼睁睁 地 看 
到 了 报 尊 s 

所 以 , 一定 要 注意 这 里 的 坑 。 


如 果 读 者 用 的 是 旧版 本 的 pymongo， 比 如 2.8 版 本 ,仍然 可 以 使 用 上 面 
的 连接 方法 ， 如 有 果 是 像 我 一 样 用 的 新 版 本 ， 束 得 注意 这 个 问题 了 。 


经 验 主义 害 死人 。 必 须 看 看 下 面 有 哪些 方法 可 以 用 : 


>>> dir(pymongo) 


['ALL', 'ASCENDING', ‘CursorType'y 'DESCENDING', 'DeleteMany', 'DeleteOne', 'GE02D', 'GEOHAYSTACK', 'GEOSPHERE', 'HASH 
ED', 'IndexModel', 'InsertOne', 'MAX 一 SUPPORTED_WIRE_ VERSION ' ， MIN SPPORTED 1 WIRE ERSTOM "MongoClient '， :MongoRep1l 
icaSsetclient', 'OFF', 'ReadPreference， 'ReplaceOne', 'ReturnDocument', 'SLOW_ ONEY 'TEXT', "UpdateMany '， ‘Updateone, 
. 'WriteConcern' builtins _"; doc ', file _', '_name_', ' package. .th nessage" 'auth 
bulk', 'client _options '， "collection'， 'command_cursor', "common'， "cursor'， 'cursor_manager', 'database' "errors! 
get_: version 本 ‘has_ 必 " ‘helpers', 'ismaster', 'message', 'mongo_client', 'mongo_replica_set_client', ‘monitor', 


"monotonic'， 'network', 'operations', 'periodic executor', 'pool', 'read_ preferences', 'response', 'results', 'server 
', "server_description'， 'server_selectors', 'server_type', 'settings', 'son manipulator', 'ssl context', 'ssl_ support 


', 'thread util', 'topology', 'topology_description', 'uri parser', 'version', 'version tuple', 'write concern'] 


瞪 大 我 的 那 双 浑 浊 迷 茫 、 布 满 血 丝 、 润 望 司 喜 的 眼睛 ， 透 过 近视 镜 的 
玻璃 片 ， 怎 么 也 找 不 到 Connection0 这 个 方法 。 原 来 ， 刚 刚 安装 的 
pymongo 变 了 , “他 变 了 ”。 

不 过 ， 我 发 现 了 MongoClient()， 这 是 一 个 峰回路转 的 发 现 。 


>>> client = pymongo.MongoClient("localhost", 27017) 


很 好 ，Python 已 经 和 MongoDB 建 立 了 连接 。 


刚才 已 经 建立 了 一 个 数据 库 mydb， 并 且 在 这 个 库 里 面 有 一 个 集合 
books， 于 是 : 


>>> db = client.mydb 


或 者 : 


>>> db = client['mydb'] 


获得 数据 库 mydb， 并 赋值 给 变量 db (这 个 变量 不 是 MongoDB 的 shell 中 
那个 tb， 此 处 的 db 就 是 Python 中 一 个 寻常 的 变量 ) 。 


>>> db.collection_names() 


[u'system.indexes', u'books'] 


查看 集合 ， 发 现 了 已 经 建立 好 的 那个 books， 于 是 再 获取 这 个 集合 ， 并 
赋值 给 一 个 变量 books: 


>>> books = db["books"] 


或 者 : 


接 下 来 ， 束 可 以 操作 这 个 集合 中 的 具体 内 容 了 。 


7.4.5 ”编辑 


刚刚 的 books 所 引用 的 是 一 个 MongoDB 的 集合 对 象 ， 它 跟前 面 学 习 过 
的 其 他 对 象 一 样 ， 有 一 些 方法 供 我 们 来 驱使 。 


>>> type(books) 


<class 'pymongo.collection.Collection'> 


>>> dir(books) 


['_BaseObject__codec options', '_BaseObject read_ preference', '_BaseObject write_ concern', '_Collection create', ' 
_Collection_ create_index', '_Collection database', '_Collection find _ and modify', '_Collection full name', '_Colle 
本 
_getattribute _', '_ getitem ', '_ hash_', '_init _', '_iter__', '_ module _', '_ne_', '_new _', '_ next__', 
_reduce _', '_reduce ex ', '_repr_', '_ setattr__', '_ sizeof__', '_ str__', '__ subclasshook _', '_ weakref_ __', '_ 
command', '_count', '_delete', '_insert', '_socket_for_primary_reads', '_socket_ for_reads', '_socket_ for writes', '_up 
date', 'aggregate', 'bulk write', 'codec options', 'count', 'create index', 'create indexes', 'database', 'delete many 
', 'delete one', 'distinct', 'drop', 'drop_index', 'drop_indexes', 'ensure_index', 'find', 'find_and modify', 'find_on 
e', 'find_one and_delete', 'find_one and_replace', 'find_one and update', 'full name', 'group', 'index_information’', ' 
initialize_ordered bulk_op', 'initialize_ unordered bulk_op', 'inline map_reduce', 'insert', 'insert many', 'insert_one 
', 'list_indexes', 'map_reduce', 'name', 'next', 'options', 'parallel scan', 'read_ preference', 'reindex', 'remove', ' 
rename', 'replace_one', 'save', 'update', 'update many', 'update_ one', 'with_options', 'write concern'] 


这 么 多 方法 不 会 一 一 介绍 ， 只 是 按照 “增删 改 查 ”的 音 用 功能 介绍 几 
种 。 读 者 可 以 使 用 helpO0 去 查看 每 一 种 方法 的 使 用 说 明 。 


>>> books.find_one() 


{u'lang': u'python', u'_id': ObjectId('554foe3cf579bc9767db9edf' )，u'author': u'qiwsir', u'title': u'from beginner to 
master'} 


提醒 读者 注意 的 是 ，MongoDB 的 shell 中 的 命令 与 pymongo 中 的 方法 有 
0 差别 ， 应 务必 小 心 。 比 如 刚才 这 个 ， 在 shell 中 是 这 样子 


> db.books.findone() 


和“ 
"_id" : ObjectId("554fQe3cf579bc0767db9edf"), 
"title" : "from beginner to master", 
"author™" : "qiwsir", 
"lang" : "python" 
} 


0 还 想 再 增加 ， 于 是 就 进入 到 了 “增删 
改 查 ”的 津 规 探 作 。 


>>> b2 = {"title":"physics", "author":"Newton", "lang":"english"} 
>>> books.insert(b2) 


ObjectId('554f28f465db941152e6df8b' ) 


成 功 地 向 集合 中 增加 了 一 个 文档 。 得 看 看 结果 (我 们 就 是 充满 好 奇 心 
的 小 孩子 ， 记 得 女儿 小 时 候 ， 每 次 给 她 照相 ， 每 拍 一 张 ， 她 总 要 看 一 
看 。 看 看 束 是 一 种 查询 。 


>>> books.find().count() 


2 


这 征 查 看 当前 集合 有 多 少 个 文档 的 方式 ， 返 回 值 为 2， 则 说 明 有 两 条 文 
档 了 。 还 是 要 看 看 内 容 。 


>>> books.find_one() 


We 


{u'lang': u'python', u'_id': ObjectId('554fOe3cf579bcO767db9edf'), u'author': u'qiwsir', u'title': u'from beginner to 
master'} 


这 个 命令 束 不 行 了 ， 因 为 它 只 返回 第 一 条 。 必 须要 : 


>>> for i in books.find(): 


print i 


{u'lang': u'python', u'_id': ObjectId('554fOe3cf579bcO767db9edf'), u'author': u'qiwsir', u'title': u'from beginner to 
master'} 


{u'lang': u'english', u'title': u'physics', u'_id': ObjectId ('554f28f465db941152e6df8b'), u'author': u'Newton'} 


在 books 引 用 的 对 象 中 有 find0 方 法 ， 它 返回 的 是 一 个 可 和 迭代 对 象 ， 包 
含 着 集合 中 所 有 的 文档 。 


由 于 文档 是 “ 键 / 值 ? 对 ， 不 一 定 每 条 文档 都 要 结构 一 样 ， 比 如 ， 也 可 以 
在 集合 中 插入 这 样 的 文档 。 


>>> books.insert({"name":"Hertz"}) 


ObjectId('554f2b4565db941152e6df8c') 
>>> for i in books.find(): 
print i 
{u'lang': u'python', u'_id': ObjectId('554foe3cf579bc09767db9edf ' )，u'author ': u'qiwsir', u'title': u'from beginner to 
master'} 
{u'lang': u'english', u'title': u'physics', u'_id': ObjectId ('554f28f465db941152e6df8b'), u'author': u'Newton'} 


{u'_id': ObjectId('554f2b4565db941152e6df8c'), u'name': u'Hertz'} 


如 有 果 有 多 个 文档 ， 想 一 下 子 都 插入 到 集合 中 (在 MySQL 中 ， 可 以 实现 
多 条 数据 用 一 条 命令 插入 到 表 里 面 ) ， 可 以 这 么 做 : 


>>> n1 = {"title":"java", "name":"Bush"} 
>>> n2 = {"title":"fortran", "name":"John Warner Backus"} 


>>> n3 = {"title":"lisp", "name":"John McCarthy"} 


>>> n = [n1，n2，n3] 


>>> nN 
[{'name': 'Bush', 'title': 'java'}, {'name': 'John Warner Backus', 'title': 'fortran'}, {'name': 'John McCarthy', 'tit 
le': 'lisp'}] 


>>> books.insert(n) 


[objectId('554f30be65db941152e6df8d'), ObjectId('554f30be65db941152e6df8e'), ObjectId('554f36be65db941152e6df8f')] 


这 样 束 完成 了 所 谓 的 批量 插入 ， 查 看 一 下 文档 条 数 : 


>>> books.find().count() 


6 


要 提醒 读者 ， 批 量 插入 的 文档 的 大 小 是 有 限制 的 ， 有 人 说 不 要 超过 20 
万 条 ， 也 有 人 说 不 要 超过 16MB， 但 我 没有 测试 过 。 在 一 般 情 况 下 ， 
或 许 达 不 到 上 限 ， 如 采 遇 到 极端 情况 ， 束 请 读者 在 使 用 时 多 注意 。 


如 果 要 查询 ， 除 了 通过 循环 之 外 ， 能 不 能 按照 某 个 条 件 查 呢 ? 比如 查 
找 mame'='Bush' 的 文档 : 


>>> books.find_one({"name":"Bush"}) 


{u'_id': ObjectId('554f30be65db941152e6df8d'), u'name': u'Bush', u'title': u'java'} 


对 于 查询 结果 ， 还 可 以 进行 排序 : 


>>> for i in books.find().sort("title", pymongo.ASCENDING): 


print i 


{u'_id': ObjectId('554f2b4565db941152e6df8c'), u'name': u'Hertz'} 
{u'_id': ObjectId('554f30be65db941152e6df8e'), u'name': U'John Warner Backus', u'title': u'fortran'} 


{u'lang': u'python', u'_id': ObjectId('554foe3cf579bc09767db9edf ' )，u'author ': u'qiwsir', u'title': u'from beginner to 
master'} 


{u'_id': ObjectId('554f30be65db941152e6df8d'), u'name': u'Bush', u'title': u'java'} 
{u'_id': ObjectId('554f30be65db941152e6df8f'), u'name': U'John McCarthy', u'title': u'lisp'} 


{u'lang': u'english', u'title': u'physics', u'_id': ObjectId ('554f28f465db941152e6df8b'), u'author': u'Newton'} 


这 是 按照 "title" 的 值 的 升序 排列 的 ， 注 意 sort0 中 的 第 二 个 参数 ， 意 思 
是 升序 排列 。 如 果 按 照 降 序 ， 就 需要 将 参数 修改 为 
pymongo.DESCEDING， 也 可 以 指定 多 个 排序 键 。 


>>> for i in 
books.find().sort([("name",pymongo.ASCENDING), ("name",pymongo.DESCENDING)]): 


print i 


{u'_id': ObjectId('554f30be65db941152e6df8e'), u'name': U'John Warner Backus', u'title': u'fortran'} 


{u'_id': ObjectId('554f30be65db941152e6df8f'), u'name': u'John McCarthy', u'title': u'lisp'} 


{u'_id': ObjectId('554f2b4565db941152e6df8c'), u'name': u'Hertz'} 
{u'_id': ObjectId('554f30be65db941152e6df8d'), u'name': u'Bush', u'title': u'java'} 


{u'lang': u'python', u'_id': ObjectId('554foe3cf579bc09767db9edf ' )，u'author ': u'qiwsir', u'title': u'from beginner to 
master'} 


{u'lang': u'english', u'title': u'physics', u'_id': ObjectId ('554f28f465db941152e6df8b'), u'author': u'Newton'} 


如 果 读 者 看 到 这 里 ， 请 务必 注意 ，MongoDB 中 的 每 个 文档 ， 本 质 上 都 
是 “ 键 / 值 ” 对 的 类 字典 结构 。 这 种 结构 ， 一 经 Python 读 出 来 ， 就 可 以 用 
字典 中 的 各 种 方法 来 操作 。 与 此 类 似 的 还 有 一 个 名 为 json 的 东西 ， 但 
是 ， 用 Python 读 过 来 之 后 ， 无 法 直接 用 json 模 块 中 的 json.dumps0) 方 法 
操作 文档 。 其 中 一 种 解决 方法 就 是 将 文档 中 的 '_id' 键 / 值 对 删除 〈 例 
如 : del doc[` id]) ， 然 后 使 用 json.dumpsO 即 可 。 读 者 也 可 使 用 
json_util 模 块 ， 因 为 它 是 “Tools for using Python's json module with 
BSON documents”， 请 阅读 
http://api.mongodb.org/python/current/api/bson/json_util.html 中 的 模块 使 
用 说 明 。 


2. 更 新 


对 于 已 有 数据 ， 更 新 是 数据 库 中 常用 的 操作 。 比 如 ， 要 更 新 name 为 
Hertz 屠 个 文档 : 


>>> books.update({"name":"Hertz"}, {"$set": {"title":"new physics", "author":"Hertz"}}) 


{u'updatedExisting': True, u'connectionId': 4, u'ok': 1.0, u'err': None, u'n': 1} 
>>> books.find_one({"author":"Hertz"}) 


{u'title': u'new physics', u'_id': ObjectId('554f2b4565db941152e6df8c'), u'name': u'Hertz', u'author': u'Hertz'} 


在 更 新 的 时 候 ， 用 了 一 个 $set 修 改 硕 ， 它 可 以 用 来 指定 键 值 ， 如 有 果 键 
不 存在 ， 就 会 创建 。 


天 于 修改 夯 ， 不 仅仅 是 这 一 个 ， 还 有 别 的 呢 ， 如 表 7-1 所 示 。 


表 7-1 修改 器 


修改 器 描 ” 述 
Sset 用 来 指定 一 个 键 的 值 。 如 果 不 存在 则 创建 它 
Sunset 完全 删除 某 个 键 
$inc 增加 已 有 键 的 值 ， 不 存在 则 创建 (只 能 用 于 增加 整数 、 长 整数 、 双 精度 浮 点 数 ) 
Spush 数组 修改 器 只 能 操作 值 为 数组 ， 存 在 key 则 在 值 末尾 增加 一 个 元 素 ， 不 存在 则 创建 一 个 数组 


删除 可 以 用 remove0 方 法 ， 稍 一 演示 ， 读 者 必 会 。 
>>> books.remove({"name":"Bush"}) 


{u'connectionId': 4, u'ok': 1.0, u'err': None, u'n': 1} 


>>> books.find_one({"name":"Bush"}) 
这 是 将 那个 文档 全 部 删除 。 当 然 ， 也 可 以 根据 MongoDB 的 语法 规则 写 
个 条 件 ， 按 照 条 件 删 除 。 
4. 索 引 


索引 的 目的 古 为 了 让 查询 速度 更 快 ， 当 然 ， 在 具体 的 项 目 开 发 中 ， 是 
个 建立 索引 要 视 情 况 而 定 ， 因 为 建立 索引 也 是 有 代价 的 。 


>>> books.create_index([("title", pymongo.DESCENDING),]) 


u'title_-1' 


这 里 仅仅 是 对 pymongo 模 块 做 了 一 个 非常 简单 的 介绍 ， 在 实际 使 用 过 
程 中 ， 上 面 的 知识 是 很 有 限 的 ， 所 以 需要 读者 根据 具体 应 用 场景 再 结 
合 MongoDB 的 有 天 知识 去 尝试 新 的 语句 。 


7.5 SQLite 数据 库 


SQLite 是 一 个 小 型 的 关系 型 数据 库 ， 它 最 大 的 特点 在 于 不 需要 服务 

右 、 堆 配置。 前 面 的 两 个 数据 库 ， 不 管 是 MySQL 还 是 MongoDB， 都 
需要 “安装 ”， 安 装 之 后 ， 才 运行 起 来 ， 其 实 是 已 经 有 一 个 相应 的 服务 
属 在 跑 着 昵 。 而 SQLite 不 需要 这 样 ， 首 先 Python 已 经 将 相应 的 驱动 模 
块 作为 标准 库 一 部 分 了 ， 只 要 安装 了 Python， 就 可 以 使 用 ， 男 外 ， 它 
也 不 需要 服务 絮 ， 可 以 类 似 操作 文件 那样 来 操作 SQLite 数 据 库 文 件 。 
还 有 一 点 也 不 错 ，SQLite 源 代码 不 受 版 权限 制 。 


SQLite 也 是 一 个 关系 型 数据 库 ， 所 以 SQL 语句 也 可 以 在 里 面 使 用 。 
与 操作 MySQL 数 据 库 类 似 ， 对 于 SQLite 数 据 库 也 要 通过 以 下 几 步 。 
。 建立 连接 对 象 。 


。 连 接 对 象 方法 ， 建 立 游标 对 象 。 
。 游 标 对 象 方法 ， 执 行 sql 语 句 。 


7.5.1 建立 连接 对 象 


由 于 SQLite 数 据 库 的 驱动 已 笃 在 Python 里 面 了 ， 所 以 ， 只 要 引用 了 束 可 
。 并 且 在 学 过 MySQL 的 基础 上 ， 理解 本 节 内 容 就 容易 多 


>>> import sqlite3 


>>> conn = sqlite3.connect("23301.db") 


这 样 就 得 到 了 连接 对 象 ， 是 不 是 比 MySQL 连 接 要 简化 了 很 多 呢 。 在 
at ("23301.db") 语句 中 ， 如 果 已 经 有 了 那个 数据 库 ， 就 
和 如 果 没 有 ， 就 新 建 一 个 。 注 意 ， 这 里 的 路 径 可 以 随意 指 
AE O 〇 


不 妨 到 目录 中 看 一 看 ， 刚 才 建 立 的 数据 库 文件 是 否 存 在 了 。 


/2code$ 1s 23301.db 


23301.db 


0 连接 对 象 建立 起 来 之 后 ， 吕 要 使 用 连接 对 象 的 方法 继续 


>>> dir(conn) 


['DataError', 'DatabaseError', "Error' Tyr 'InterfaceError', 'InternalError', 'NotSupportedError', 'Ope 
rationalError', "ProgrammingError '， ‘Warn ning', ' all 1 '_class _', '_delattr_', '_doc ', '_ enter__', '_ exit 
format__', '__getattribute __', ' hash '__init ', '_ new _', '_reduce ', '_reduce ex _', '_repr__', 
setattr ', '_ sizeof ', '_ str ', '_ subclasshook ', 'close', 'commit', 'create aggregate', 'create collation', 
'create_function', 'cursor', 'enable load extension', 'execute', 'executemany', 'executescript', 'interrupt', 'isolati 
on_level', 'iterdump', 'load_ extension', 'rollback', 'row factory', 'set authorizer', 'set_progress handler', 'text_fa 

ctory', 'total changes'] 


7.5.2 ”游标 对 和 象 
一 步 跟 MySQL 也 类 似 ， 要 建立 游标 对 象 。 


>>> cur = conn.cursor() 


接 下 来 对 数据 库 内 容 进 行 操 作 ， 都 是 用 游标 对 象 方法 来 实现 : 


>>> dir(cur) 


[人 
', '_reduce_ ', '_reduce ex _', '_repr__', '_ setattr__', '_ sizeof_', '_ str__', '__ subclasshook_'，'arraySsize' 
'close', 'connection', 'description', 'execute', 'executemany', 'executescript '， "fetchall' 'fetchmany', 'fetchone '， 
'lastrowid', 'next', 'row factory', 'rowcount', 'setinputsizes', 'setoutputsize'] 


看 到 熟悉 的 名 称 了 : close()、execute() 、executemany() 、 fetchall()。 


1. 创 建 数据 库 表 
ee 


>>> Create_table = "create table books (title text, author text, lang text) " 
>>> cur.execute(create_ table) 


<sqlite3.Cursor object at 0xb73ed5a0> 


0 


>>> cur.execute('insert into books values ("from beginner to master", "laoqi", "python")') 


<sqlite3.Cursor object at QOxb73ed5a0> 


0 
命令 呀 ) : 


>>> cur.close() 


>>> conn.close() 


在 刚才 建立 的 那个 数据 库 中 ， 已 经 有 了 一 个 表 books， 表 中 已 经 有 了 一 


条 记录 。 
2. 查 询 


存 进去 了 ， 总 要 看 看 : 


>>> conn = sqlite3.connect("23301.db") 
>>> cur = conn.cursor() 
>>> cur.execute('select * from books') 
<sqlite3.Cursor object at QOxb73edea0> 
>>> print cur.fetchall() 


[(u'from beginner to master', u'laoqi', u'python')] 


3. 批 量 插 入 
多 增加 点 内 容 ， 以 便于 做 别 的 操作 : 


>>> books = [("first book","first","c"), ("second book","second","c"), ("third book","second", "python")] 


批量 插入 : 


>>> cur.executemany('insert into books values (?,?,?)', books) 
<sqlite3.Cursor object at 0xb73edea0> 


>>> conn.commit() 


用 循环 语句 打印 查询 结 


>>> rows = cur.execute('select * from books') 
>>> for row in rows: 


print row 


(u'from beginner to master', u'laoqi', u'python') 
Cu'Tirst book’; dFiret": ge) 
(u'second book', u'second', u'c') 


(u'third book', u'second', u'python') 


4. 更 新 
正如 前 面 所 说 ， 在 curexecute0 中 ， 你 可 以 写 SQL 语 句 来 操作 数据 库 。 


>>> CuUr .execute("update books set title='physics' where author='first'") 
<sqlite3.Cursor object at 0xb73edea0> 


>>> conn.commit() 


按照 条 件 查处 来 看 一 看 : 


>>> cur.execute("select * from books where author='first'") 
<sqlite3.Cursor object at QOxb73edea0> 
>>> cur.fetchone() 


Cu physice, uu' Tirst’: uc!} 


5. 删 除 


在 操作 数据 的 过 程 中 ， 删 除 是 必须 要 掌握 的 。 


>>> cur.execute("delete from books where author='second'") 


<sqlite3.Cursor object at QOxb73edea0> 


>>> conn.commit() 


>>> cur.execute("select * from books") 
<sqlite3.Cursor object at QOxb73edea0> 
>>> cur.fetchall() 


[(u'from beginner to master', u'laoqgi', u'python'), (u'physics', u'first', u'c')] 


在 你 完成 对 数据 库 的 操作 时 ， 一 定 要 天 门 才能 走 人 : 


cur.close() 
conn.close() 


基本 知识 已 经 介绍 差不多 了 。 当 然 ， 在 编程 实践 中 ， 或 许 还 会 过 到 问 
题 ， 融 请 读 着 多 参考 官方 文档 。 


7.6 ”电子 表格 


一 提 到 电子 表格 ， 可 能 立刻 想到 的 是 Excel。 殊 不 知 ， 电 子 表格 “历史 
悠久 "”， 比 Word 要 长 人 多 了 “。 根 据 维基 百科 的 记载 整理 一 个 向 史 : 


VisiCalc 是 第 一 个 电子 表格 程序 ， 用 于 苹果 二 号 计算 机 。 由 丹 : 布 李 元 
林 (Dan Bricklin) 和 鲍 伯 :法 兰 克 斯 顿 (Bob Frankston) 发 展 而 成 ， 
跟着 苹果 二 号 计算 机 推出 ， 成 为 苹 采 二 号 计算 机 上 的 “杀手 
必用 软件 ”。 


接 下 来 是 Lotus 1-2-3， 由 Lotus Software (美国 莲花 软件 公司 ) 于 1983 
年 起 所 推出 的 电子 表格 软件 ， 在 DOS 时 期 广 为 个 人 计算 机 用 户 所 使 
是 一 套 杀 手 级 应 用 软件 。 也 是 世界 上 第 一 个 销售 超过 100 万 套 的 软 


然后 微软 也 开始 做 电子 表格 ， 早 在 1982 年 ， 推 出 了 其 第 一 款 电 子 制 表 
软件 一 -Multiplan， 并 在 CP/M 系 统 上 大 获 成 功 ， 但 在 MS-DOS 系 统 上 ， 
Multiplan 败 给 了 Lotus 1-2-3。 


1985 年 ， 微 软 推 出 第 一 款 Excel， 但 它 只 用 于 Mac 系 统 ; 直到 1987 年 11 
月 ， 微 软 的 第 一 款 适 用 于 Windows 系 统 的 Excel 才 诞生 ， 不 过 ， 它 一 出 
来 ， 束 与 Windows 系 统 直 接 捆绑 ， 由 于 此 后 Windows 大 行 其 道 ， 并 日 

Lotus1-2-3 迟 迟 不 能 适用 于 Windows 系 统 ， 到 了 1988 年 ，Excel 的 销量 超 
过 了 lotus 1-2-3 。 


此 后 就 是 微软 的 天 下 了 ，Excel 后 来 又 并 入 了 Office 里 面 ， 成 为 了 


Microsoft Office Excel ° 
尽管 Excel 已 经 发 展 了 很 多 代 ， 提 供 了 大 量 的 用 户 界 面 特 性 ， 但 它 仍然 


保留 了 第 一 款 电 子 制 表 软 件 VisiCalc 的 特性 : 行 、 列 组 成 单元 格 ， 数 
` 与 数据 相关 的 公式 或 者 对 其 他 单元 格 的 绝对 引用 你 存在 单元 格 


由 于 微软 独霸 天 下 ，Lotus 1-2-3 已 经 淡出 了 人 们 的 视线 ， 甚 至 很 多 人 
误 认 为 历史 就 是 从 微软 开始 的 。 


其 实 ， 除 了 微软 的 电子 表格 ， 在 Linux 系 统 中 也 有 很 好 的 电子 表格 ， 
Google 也 提供 了 不 错 的 在 线 电 子 表格 。 


从 历史 到 现在 ， 电 子 表格 都 有 很 广泛 的 用 途 。 所 以 ，Python 也 要 操作 
一 番 电 子 表格 ， 因 为 有 些 数 据 ， 吏 是 存在 于 电子 表格 中 。 


7.6.1 openpyl 


openpyl 模 块 是 解决 Microsoft Excel 2007/2010 之 类 版 本 中 扩展 名 是 Excel 
2010 xlsx/xlsm/xltx/xltm 的 文件 的 读 写 的 第 三 方 库 。 


一 十 二 
.安装 


安 逆 第 三 方 库 ， 当 然 用 法 力 无 边 的 pip install 。 


$ sudo pip install openpyxl 


| 


如 有 果 最 终 看 到 了 下 面 的 提示 ， 茶 喜 你 ， 安 闭 成 功 。 


Successfully installed openpyxl1 jdcal 


Cleaning up... 


2.workbook 和 sheet 
第 一 步 ， 引 入 模块 ， 用 下 面 的 方式 : 


>>> from openpyxl1 import Workbook 


接 下 来 用 WorkbookO 类 里 面 的 方法 展开 工作 : 


>>> wb = Workbook() 


请 回忆 Excel 文 件 ， 如 果 想 不 起 来 ， 丈 打开 Excel， 第 一 眼看 到 的 钙 一 
个 称 之 为 工作 筹 (workbook) 的 东西 ， 里 面 有 儿 个 sheet， 默 认 是 三 
个 ， 当 然 可 以 随意 增删 。 默 认 使 用 第 一 个 sheet 。 


> ws = wb.active 


在 每 个 工作 短 中 人 至少 有 一 个 sheet， 通 过 这 条 指令 ， 束 在 当前 工作 短 中 
建立 了 一 个 sheet， 并 且 它 是 当前 正在 使 用 的 。 


还 可 以 在 这 个 sheet 后 面 妃 加 : 


> ws1 = wb.create_sheet() 


其 至， 还 可 以 插队 : 
在 第 二 个 位 置 插入 了 一 个 sheet 。 
在 Excel 文 件 中 一 样 ， 创 建 了 sheet 之 后 ， 默 认 都 是 


以 “Sheet1”、“Sheet2” 的 样子 来 命名 的 ， 然后 我 们 可 以 给 其 重新 命名 。 
在 这 里 ， 依 然 可 以 这 么 做 。 


> ws.title = "python" 


ws 所 引用 的 sheet 对 象 名 字 束 是 "python” 了 。 
此 时 ， 可 以 使 用 下 面 的 方式 从 工作 短 对 象 中 得 到 sheet 


so1 = wb['python'] #Ssheet 和 工作 得 的 关系 ， 类 似 键 / 值 对 的 关系 
Ss ws01 
True 
和 » 
或 者 用 这 种 方式 : 
s02 = wb.get_sheet_by_name("python") 


S ws02 


True 


整理 一 下 到 目前 为 止 我 们 已 经 完成 的 工作 : 建立 了 工作 筹 (wb) 和 三 
个 sheet。 还 是 显示 一 下 比较 好 : 


>>> print wb.get_sheet_names() 


['python', 'Sheet2', 'Sheet1'] 


Sheet2 之 所 以 排 在 了 第 二 位 ， 是 因为 在 建立 的 上 时候， 用 了 一 个 插队 的 
方法 。 这 跟 在 Excel 中 差不多 ， 如 果 Sheet 命 名 了 ， 职 按照 那个 名 字 显 
示 ， 否 则 就 默认 为 名 字 是 "Sheet1" (注意 ， 第 一 个 字母 大 写 ) 。 


也 可 以 用 循环 语句 ， 把 所 有 的 sheet 名 字 打 印 出 来 。 


>>> for sh in wb: 


print sh.title 
python 


Sheet2 


Sheet1 


如 果 读 者 去 dir (wb) 工作 短 对 象 的 属性 和 方法 ， 会 发 现 它 具 有 迭代 的 
特征 _iter “方法 ， 这 说 明 工 作 短 是 可 和 迭代 的 。 


3.cell 


为 了 能 够 清楚 地 理解 填 数 据 的 过 程 ， 将 电子 表 中 约定 的 名 称 以 图 7-1 的 
方式 说 明 : 


0 其 中 的 cell 是 它 的 下 级 单位 。 所 以 ， 要 得 到 某 个 cell 可 以 这 


b4 = ws['B4'] 


如 果 B4 这 个 cell 已 经 有 了 ， 用 这 种 方法 就 是 将 它 的 值 赋 给 了 变量 b4: 
如 果 sheet 中 没有 这 个 cell， 那 么 就 创建 这 个 cell 对 象 。 


| this is a cell 


= 模 则 称 为 :TOW 


+his is a celI 一 
Tt—is i 


坚 直 方 同 ( 维 同 ) 力 : 


column 


图 7-1 电子 表 中 约定 的 名 称 


请 读者 注意 ， 当 我 们 打开 Excel， 默 认 已 经 画 好 了 很 多 cel。 但 是 ， 在 
Python 操作 的 电子 表格 中 ， 不 会 默认 画 好 那样 一 个 表格 ， 一 切 都 要 创 
建 之 后 才 有 。 所 以 ， 如 果 按 照 前 面 的 操作 流程 ， 上 面 就 是 创建 了 B4 这 
个 cell， 并 且 把 它 作 为 一 个 对 象 被 b4 变 量 引 用 。 


如 条 要 给 B4 添 加 数据 ， 可 以 这 么 做 : 


>>> ws['B4'] = 4444 


Ncell 对 象 ， 所 以 可 以 利用 这 个 对 象 的 属性 来 查看 其 


>>> b4.value 


4444 


要 获得 (或 者 建立 并 获得 ) 某 个 cell 对 象 ， 还 可 以 使 用 下 面 的 方法 : 


>>> al = ws.cell("A1") 


刚才 已 经 提 到 ， 在 建立 了 Sheet 之 后 ， 内 存 中 的 它 并 没有 cell， 需 要 程 
人 
类 们 下 面 ， 


1A11B11c1| |A2|B2|c2| |A31B31c31 


束 可 以 如 同 切 片 那样 来 操作 : 


>>> cells = ws["A1i":"c3"] 


可 以 用 下 面 的 方法 查看 创建 结 采 : 


>>> tuple(ws.iter_rows("A1:C3")) 
((<Cell python.A1>，<Cel1 python.B1>, <Cell python.C1>)， 
(<Cell python.A2>, <Cell python.B2>, <Cell python.C2>)， 


(<Cell python.A3>, <Cell python.B3>, <Cell python.c3>)) 


这 是 按照 横向 顺序 读 过 来 的 ， 即 Al1-B1-C1， 作 为 一 个 元 组 ， 然 后 读 下 
一 行 ， 再 组 成 一 个 元 组 。 还 可 以 用 下 面 的 循环 方法 ， 个 贡 访 到 
每 个 cell 对 象 : 


>>> for row in ws.iter_rows("A1:C3"): 
for cell in row: 


print cell 


<Cell python.A1> 
<Ce python.B1> 
<Ce python.C1> 
<Cell python.A2> 
<Ce python.B2> 
<Ce python.c2> 
<Ce python.A3> 


<Ce python.B3> 


<Ce python.c3> 


也 可 以 用 Sheet 对 象 的 rows 属 性 ， 得 到 按照 横向 顺序 依次 排列 的 cell 对 
象 (注意 观察 结果 ， 因 为 没有 进行 范围 限制 ， 所 以 目前 是 sheet 中 所 有 
的 cell， 前 面 已 经 建立 到 第 四 行 B4， 所 以 ， 要 比 上 面 的 操作 多 一 个 


row) 


>>> ws .rows 

((<Cell python.A1i>, <Cell python.B1>, <Cell python.c1>), 
(<Cell python.A2>, <Cell python.B2>, <Cell python.c2>), 
(<Cell python.A3>, <Cell python.B3>, <Cell python.C3>)， 


(<Cell python.A4>, <Cell python.B4>, <Cell python.c4>)) 


用 sheet 对 象 的 columns 属 性 ， 得 到 的 是 按照 纵 同 顺序 排列 的 cell 对 象 


(注意 观察 结果 ) 


>>> ws.columns 
((<Cell python.A1>, <Cell python.A2>, <Cell python.A3>, <Cell python.A4>), 
(<Cell python.B1>, <Cell python.B2>, <Cell python.B3>, <Cell python.B4>), 


(<Cell python.c1i>, <Cell python.c2>, <Cell python.c3>, <Cell python.c4>)) 


不 管用 哪 种 方法 ， 只 要 得 到 了 ce 对象 ， 接 下 来 瓯 可 以 依次 赋值 了 。 比 
如 要 在 上 面 的 表格 中 ， 依 次 填写 上 1、2、3、.……. 


人 
>>> for cell in ws.rows: 
cell.value = i 


和 


... Traceback (most recent call last): File "", line 2, in AttributeError: 'tuple' object has no attribute 'value' 


报错 了 ， 关 键 是 没有 注意 观察 上 面 的 结 有 末 。 元 组 里 面 是 以 元 组 为 元 
素 ， 再 里 面 才 是 cell 对 象 。 所 以 ， 必 须要 “时 时 和 警醒?， 各 间 谨 慎 。 


>> for row in ws.rows: 


如 此 ， 给 每 个 cell 添 加 了 数据 。 碍 看 一 下 ， 不 过 要 换 一 个 属性 : 


虽然 看 着 有 点 不 舒服 ， 但 的 确 达 到 了 前 面 的 要 求 。 
4. 保 存 
把 辛苦 工作 的 结果 保存 一 下 吧 。 


>>> wb.save("23401.xlsx") 


如 果 有 同名 文件 存在 ， 会 覆盖 。 
此 时 ， 可 以 用 Excel 打 开 这 个 文件 ， 看 看 可 视 化 的 结果 : 


LP 
局 
FF co nm 
Dm eo 


5. 读 取 已 有 文件 
如 采 已 经 有 一 个 ,xlsx 文 件 ， 要 读 取 它 ， 可 以 这 样 做 : 


>>> from openpyxl1 import load workbook 
>>> wb2 = load workbook("23401.xlsx") 
>>> print wb2.get_sheet_names() 
['python', 'Sheet2', 'Sheet1'] 

>>> ws_wb2 = wb2["python"] 

>>> for row in ws_wb2.rows: 

for cell in row: 


print cell.value 


很 好 ， 就 是 这 个 文件 。 
7.6.2 其 他 第 三 方 库 


针对 电子 表格 的 第 三 方 库 ， 除 了 上 面 这 个 openpyxl 之 外 还 有 别 的 ， 下 
面 列 出 几 个 仅 供 参考 ， 使 用 方法 大 同 小 异 。 


。 Xlsxwriter: 针对 Excel 2010 格 式 ， 如 .xlsx， 官 方 网 站 : 
https:/xlsxwriterreadthedocs.org/， 这 个 官方 文档 写 得 图 文 并 成 。 
非常 好 读 。 


下 面 两 个 是 用 来 处 理 .xls 格 式 的 电子 表 表 格 。 
。xlrd: 网 络 文 件 ， 


https://secure.simplistix.co.uk/svn/xlrd/trunk/xlrd/doc/xlrd.html? 
=4966。 
。 Xlwt: 网 络 文 件 ，http://xlwt.readthedocs.org/en/latest/。 


第 3 季 ”实战 


通过 前 面 的 学 习 ， 已 经 掌握 了 Python 的 基本 内 容 ， 不 少 读者 可 能 此 时 
已 经 跃跃欲试 ， 迫 切 地 想 用 已 经 掌握 的 技术 去 做 点 什么 。 


本 季 束 古 要 讲 一 些 实战 的 东西 。 


因为 本 书 毕 竟 是 一 本 向 初学 者 讲述 Python 的 教程 ， 所 以 在 实战 中 的 所 
有 例子 ， 跟 真正 的 工程 代码 要 求 还 有 一 定 的 差距 ， 比 如 可 能 没有 非常 
优化 ， 或 者 某 些 语句 和 方法 的 使 用 还 需要 进一步 推 殴 。 也 有 盼望 读者 能 
够 指出 不 足 ， 必 改正 。 


其 人 次， 所谓“ 实战 ?， 多 少 有 点 纸上谈兵 的 味道 ， 也 束 是 将 有 某 些 东西 稍 
微 颖 探 ， 真 正 深奥 的 东西 还 要 等 读者 在 实际 的 工程 中 去 体会 。 并 且 ， 
也 不 要 寄 和 希望 在 这 里 束 能 奉 代 实践 工作 。 


第 8 章 ” 用 Tornado 做 网 站 


上 网 干什么 ? 登录 某 个 网 站 是 必 不 可 少 的 。 网 站 十 谁 做 的 呢 ? 当然 是 
伟大 的 程序 员 做 的 。 网 站 有 很 多 种 ， 做 网 站 的 方式 方法 也 有 很 多 种 。 
本 章 仅 介绍 利用 Python 语言 开发 网 站 的 基本 方法 ， 而 且 这 个 网 站 仅 具 
有 最 基本 的 功能 。 或 者 说 ， 这 里 只 是 一 个 做 网 站 的 引子 ， 帮 读者 搭建 
一 个 梁子 ， 至 于 里 面具 体 的 内 容 ， 还 需要 读 着 在 以 后 的 开发 中 目 己 创 


HN 


8.1 为 做 网 站 而 准备 


作为 一 个 程序 员 一 定 要 会 做 网 站 ， 因 为 如 条 被 人 问 及 此 事 ， 而 说 目 己 
不 会 ， 的 确 佬 愧 难当 呀 。 所 以 ， 要 讲 一 讲 如 何 做 网 站 。 


首先 ， 为 目 己 准 备 一 个 服务 右 。 这 个 要 求 似乎 有 点 儿 过 分 ， 作 为 一 个 
普通 的 、 穷 困 流 倒 的 程序 员 ， 哪 里 有 钱 来 购买 服务 怖 呢 ? 没关系 ， 不 
够 天 服务 融 也 能 做 网 站 ， 可 以 购买 云 服 务 空 间或 者 虚拟 空间 ， 这 个 在 
网 上 搜索 一 下 ， 有 很 多 。 如 采 连 购买 这 个 的 钱 也 没有 ， 还 可 以 将 目 己 
的 电脑 (这 总 该 有 了 ) 作为 服务 服务 器 。 我 就 是 利用 一 台 装 有 Ubuntu 
操作 系统 的 个 人 电脑 作为 本 书 的 案例 演示 服务 器 。 


然后 ， 要 在 这 个 服务 右上 做 一 些 程序 配置 。 一 些 必 备 的 网 络 配 置 这 里 
束 不 说 了 ， 比 如 我 用 的 Ubuntu 系统 ， 默 认 情 况 都 有 了 “。 另 外 的 配置 惑 
征 Python 开 发 环境 ， 这 个 应 该 也 有 了 ， 前 面 已 经 在 用 了 。 


接 下 来 要 安装 一 个 框架 ， 这 里 采用 Tornado 框 架 。 在 安装 这 个 框架 之 
前 ， 先 了 解 一 些 相 关 知 识 。 


811 开发 框 染 


对 框 染 的 认识 ， 由 于 工作 习惯 和 工作 内 容 的 不 同 ， 会 有 很 大 差异 ， 这 
里 姑且 截取 维基 百科 中 的 一 种 定义 ， 之 所 以 要 给 出 一 个 定义 ， 无 非 是 
0 


软件 框架 (Software framework) ， 通 常 指 的 是 为 了 实现 某 个 业界 标准 
或 完成 特定 基本 任务 的 软件 组 件 规范 ， 也 指 为 了 实现 某 个 软件 组 件 规 
范 时 ， 提 供 规范 所 要 求 之 基础 功能 的 软件 产品 。 


框架 的 功能 类 似 于 基础 设施 ， 与 具体 的 软件 应 用 无 天 ， 但 十 提供 并 实 
现 最 为 基础 的 软件 架构 和 体系 。 软 件 开发 者 通常 依据 特定 的 框架 实现 
更 为 复杂 的 商业 运用 和 业务 逻辑 。 这 样 的 软件 应 用 可 以 在 文 持 同 一 种 
框架 的 软件 系统 中 运行 。 


简 而 言 之 ， 框 架 就 是 制定 一 套 规范 或 者 规则 (思想 ) ， 大 家 (程序 
员 ) 在 该 规范 或 者 规则 (思想 ) 下 工作 。 就 好 比 使 用 别人 搭 好 的 舞 


op 


， 你 来 做 表演 。 


我 比较 喜欢 最 后 一 句 解释 “别人 搭 好 舞台 ， 我 来 表演 ”。 这 也 殉 是 说 ， 
在 做 软件 开发 的 时 候 ， 能 够 减少 工作 量 。 束 做 网 站 来 讲 ， 其 实 需 要 做 
ee 但 是 如 果 有 了 开发 框架 ， 很 多 奈 层 的 事情 整 不 需要 做 


有 些 高 手工 程 师 副 视 框 腰 ， 认 为 目 己 编写 的 才 是 王道 。 在 这 方面 不 争 
We 我 还 是 固执 地 认为 用 框架 来 开发 更 
>| A 可 


8.1.2 Python 框架 


有 人 说 PHP 框 架 多 ，PHP 的 开发 框架 的 确 很 多 ， 不 过 ，Python 的 Web 开 
发 框架 ， 也 足够 使 用 了 ， 列 举 几 种 常见 的 Web 框架 ; 


。 Django: 这 是 一 个 被 广 沁 应 用 的 框架 。 在 网 上 搜索 ， 会 发 现 很 多 
公司 在 招聘 的 时 候 都 要 求 会 这 个 。 框 架 只 是 辅助 ， 真 正 的 程序 
Ol 。 当然 不 同 的 框架 有 不 同 的 特点 ， 需 要 学 
习 一 段 时 间 。 

Flask: 一 个 用 Python 编写 的 轻 量 级 Web 应 用 框架 。 基 于 Werkzeug 
WSGI 工 具 箱 和 Jinja2 模 板 引 擎 。 

Web2py: 是 一 个 为 Python 语 言 提 供 的 全 功能 Web 应 用 框架 ， 旨 在 
敏捷 快速 地 开发 Web 应 用 ， 具 有 快速 、 安 全 以 及 可 移植 的 数据 库 
驱动 的 应 用 ， 兼 容 Google App Engine 。 

Bottle: 微型 Python Web 框 架 ， 遵 循 WSGI， 说 其 微型 ， 是 因为 它 
一 个 文件 ， 除 Python 标 准 库 外 ， 它 不 依赖 于 任何 第 三 方 模 


Tornado: 全 称 是 Tornado Web Server， 从 名 字 上 看 就 知道 它 可 以 
用 作 Web 服 务 器 ， 但 同时 它 也 是 一 个 Python Web 的 开发 框架 。 最 
ee 的 网 站 上 使 用 ，FaceBook 收 购 了 之 后 便 开 
源 了 。 
webpy: 轻 量 级 的 Python Web 框 架 。webpy 的 设计 理念 力求 精简 
(Keep it simple and powerful) ， 源 码 很 简短 ， 只 提供 一 个 框架 所 
必需 的 东西 ， 不 依赖 大 量 的 第 三 方 模块 ， 它 没有 URL 路 由 、 没 有 
模板 也 没有 数据 库 的 访问 。 


以 上 信息 选 自 ，http:/Wblog.jobbole.com/72306/， 在 这 篇 文章 中 还 有 别 的 
开 锋 ， 由 于 不 是 Web 框 架 ， 所 以 没有 选 摘 ， 有 兴趣 的 读者 可 以 去 阅 


8.1.3 Tornado 
本 教程 中 将 选择 使 用 Tornado 框 架 。 


Tornado 全 称 Tornado Web Server， 是 一 个 用 Python 语言 写成 的 Web 服 务 
性 兼 Web 应 用 框架 ， 由 FriendFeed 公 司 在 自己 的 网 站 FriendFeed 中 使 
用 ， 被 Facebook 收 购 以 后 框架 以 开源 软件 的 形式 开放 给 大 从 。 


一 般 用 哪个 框架 要 结合 项 目 而 定 。 我 选用 Tornado 的 原因 ， 台 是 看 中 了 
它 在 性 能 方面 的 优异 表现 。 

Tormnado 的 性 能 是 相当 优异 的 ， 因 为 它 试 图 解决 一 个 被 称 之 为 “C10k” 问 
题 ， 攀 是 处 理 大 于 或 等 于 一 万 的 并 发 。 


如 表 8-1 所 示 是 和 一 些 其 他 Web 框 架 与 服务 絮 的 对 比 ， 供 读者 参考 ( 数 
据 来 源 : https://developers.facebook.com/blog/post/301) 。 


条 件 : 处 理 需 为 AMD Opteron， 主 频 2.4GHz，4 核 。 


表 8-1 其 他 Web 框 架 与 服务 器 的 对 比 


部 署 
nginx，4 进程 
1 个 单线 程 进程 


Apache/mod wsegi 


Apache/mod wsegi 


看 了 这 个 对 比 表格 ， 还 有 什么 理由 不 选择 Tornado 呢 ? 


影响 一 个 网 站 性 能 的 因素 ， 不 完全 在 于 框架 ， 还 有 别 的 因素 ， 上 面 的 
比较 仅 供 参考 。 


8.1.4 安装 Tornado 


Tornado 的 官方 网 站 : http:/www.tornadoweb.org。 


我 在 自己 的 电脑 中 〈 是 我 目前 使 用 的 服务 器 ) ， 用 下 面 的 方法 安装 ， 


pip install tornado 


这 是 因为 Tomado 已 经 列 入 PyPT， 因此 可 以 通过 pip 或 者 easy_install 来 安 


装 。 


如 采 不 用 这 种 方式 安装 ， 下 面 的 链接 中 有 可 以 供 读 者 下 载 的 最 新 源码 
版 本 和 安装 方式 : https: pt python.org/pypi/tornado/ ° 


此 外 ， 在 github 上 也 有 托管 ， 读 者 可 以 通过 上 述 页 面 进入 到 github 看 源 
码 。 


我 没有 在 Windows 操 作 系 统 上 安 洲 过 这 个 ， 不 过 ， 在 官方 网 站 上 有 一 
人 句 话 ， 在 告诉 读者 一 些 信息 : 


Tor d ts also run on Windows, although this configuration is not officially supported and is recommended only for 
特别 建议 ， 在 真正 的 工程 中 ， 网 站 的 服务 器 还 是 用 Linux 比 较 好 。 


最 后 说 明 一 下 ， 要 做 网 站 ， 除 了 做 好 上 述 准 备 之 外 ， 还 要 有 点 别 的 技 
: 


。 HTML 
。 CSS 
。 JavaScript 


8.2 分析 Hello 


打开 你 写 Python 代 码 用 的 编辑 上 囊 ， 把 下 面 的 代码 一 个 字 不 奔 地 录入 进 
去 ， 并 命名 保存 为 hello.py (目录 自己 任意 定 ) 。 


#!/usr/bin/env python 


#coding:utf-8 


ort tornado.httpserver 


rt tornado.ioloop 


rt torna 


d 
d 
do.options 
d 


i 

号 号 号 三 

如 已 如 eS 
口 口 


ort tornado .web 


from tornado.options import define, options 


define("port"，default=8000，help="run on the given port", type=int) 


class IndexHandler(tornado .web.RequestHandler ) : 


def get(self): 


greeting = self.get_argument('greeting', 'Hello') 
Self.write(greeting + ', welcome you to read: www.itdiffer.com') 
if name == "main__" 


tornado.options.parse_command_line() 

app = tornado.web.Application(handlers=[(r"/", IndexHandler)]) 
http_server = tornado.httpserver .HTTPServer (app) 
http_server.listen(options.port) 


tornado.ioloop.IOLoop.instance().start() 


进入 到 保存 hello.py 文 件 的 目录 ， 执 行 : 


$ python hello.py 


用 Python 运行 这 个 文件 ， 其 实 就 已 经 发 布 了 一 个 网 站 ， 只 不 过 这 个 网 
站 太 简 单 了 。 诚 然 ， 这 是 有 前 提 的 ， 那 就 是 已 经 按照 上 一 节 的 流程 把 
Tornado 安 装 好 了 。 
接 下 来 ， 打 开 浏览 器， 在 浏览 器 中 输入 : http://localhost:8000， 得 到 如 
图 8-1 所 示 的 界面 。 

http://localhost:8000/ 


© @localhost 


Hello, welcome you to read: www.itdiffer.com 


图 8-1 ”网 站 界面 


在 Ubuntu 的 shell 中 还 可 以 用 下 面 的 方式 运行 : 


$ curl http://localhost:8000/ 


Hello, welcome you to read: www.itdiffer.com 


$ curl http://localhost:8000/?greeting=Qiwsir 


Qiwsir, welcome you to read: www.itdiffer.com 


此 操作 ， 读 者 可 以 根据 目 己 的 系统 而 定 。 


不 管 怎样 ， 都 要 茶 喜 你 ， 迈 出 了 决定 性 一 步 ， 已 经 可 以 用 Tomado 发 布 
网 站 了 。 在 这 里 似乎 没有 做 什么 部 署 ， 只 是 安装 了 Tomado。 是 的 ,不 
需要 多 做 什么 ， 因 为 Tornado 就 是 一 个 很 好 的 server， 也 是 一 个 框架 。 


下 面 以 这 个 非常 简单 的 网 站 为 例 ， 对 用 Tomado 做 的 网 站 的 基本 结构 进 
行 解释 。 


8.2.1 Web 服务 器 工作 流程 


任何 一 个 网 站 都 离 不 开 Web 服 务 占 ， 这 里 所 说 的 不 是 指 那 个 跟 计 算 机 
一 样 的 硬件 设备 ， 而 古 指 里 面 安 净 的 软件 ， 有 时 候 初次 接触 的 读者 容 
易 搞 混 。 束 连 伟大 的 维基 百科 都 这 么 说 : 


有 时 ， 两 种 定义 会 引起 混 消 ， 如 Web 服 务 器 ， 它 可 能 是 指 用 于 网 站 的 
计算 机 ， 也 可 能 是 指 像 Apache 这 样 的 软件 ， 运 行 在 这 样 的 计算 机 上 以 
管理 网 页 组 件 和 回应 网 页 浏览 万 的 请 求 。 


在 具体 的 语 境 中 ， 读 者 要 注意 分 析 。 


在 Web 上 ， 用 得 最 多 的 就 是 输入 网 址 ， 访 问 某 个 网 站 。 全 世界 那么 多 
网 站 网 页 ， 如 果 去 访问 ， 怎 么 能 够 做 到 彼此 互通 互联 呢 ? 为 了 协调 彼 
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网 上 有 一 张 图 (http://kenby.iteye.com/blog/1159621) ， 如 图 8-2 所 示 ， 
人 简要 说 明 Web 服 务 器 的 工作 过 程 


Web server 


read http header and body data 


-一 | 
request | 
ae, CD handle request 
SS | WSO ON 


Bg 


图 8-2 ”Web 服 务 器 的 工作 过 程 


为 了 让 读者 能 更 理解 ， 把 原文 中 对 图 示 的 说 明 也 贴 上 : 
1. 创 建 listen socket， 在 指定 的 监听 端口 ， 等 行 客户 端 请 求 的 到 来 。 


2.listen socket 接 受 客户 端的 请 求 ， 得 到 client socket， 接 下 来 通过 client 
socket 与 客户 端 通 信 。 


3. 处 理 客户 端的 请 求 ， 首 先 从 client socket 读 取 http 请 求 的 协议 头 ， 如 果 
是 post 协 议 ， 还 可 能 要 读 取 客户 端 上 传 的 数据 ， 然 后 处 理 请 求 ， 准 备 
好 客户 端 需要 的 数据 ， 通 过 client socket 写 给 客户 端 。 

8.2.2 ”解剖 标本 


前 面 跑 起 来 的 那个 网 站 ， 驶 算是 一 个 标本 了 ， 分 析 这 个 网 站 ， 能 让 我 
们 对 网 站 的 概况 有 所 了 解 。 


1. 引 入 模块 


import tornado.httpserver 


import tornado.ioloop 


import tornado .options 


import tornado .web 


这 四 个 都 是 Tornado 的 模块 ， 在 本 例 中 都 是 必需 的 。 它 们 四 个 在 一 般 的 
网 站 开发 中 ， 痢 要 被 用 到 ， 基 本 作用 分 别 如 下 。 


。 tornado.httpserver: 这 个 模块 用 来 解决 Web 上 服务 絮 的 http 协 议 问 
蚌 ， 它 提供 了 不 少 属性 方法 ， 实 现 客户 端 和 服务 器 端的 互通 。 
Tornado 的 非 阻塞 、 单 线程 的 特点 在 这 个 模块 中 体现 。 

。 tornado.ioloop: 这 个 也 非常 重要 ， 实 现 MO 循 环 ， 监 听 用 户 请 求 ， 
然后 映射 具体 的 处 理 ， 再 返 给 用 户 相 应 的 结果 。 

。 tornado.options: 这 是 命令 行 解析 模块 ， 也 常用 到 。 

。 tornado.web: 这 是 必 不 可 少 的 模块 ， 它 提供 了 一 个 人 简单 的 Web 框 
架 与 异步 功能 ， 从 而 使 其 扩展 到 大 量 打 开 的 连接 ， 使 其 成 为 理想 
的 长 轮 询 。 

读者 看 到 这 里 可 能 有 点 莫名 其 妙 ， 对 这 些 东 西 不 理解 。 没 关系 ， 你 可 
以 先 不 用 管 它 。 一 定 要 人 硬 着 头皮 一 字 一 句 地 读 下 去 ， 随 着 学 习 和 实践 
的 深入 ， 现 在 不 理解 的 以 后 会 逐渐 领悟 。 


还 有 一 个 模块 引入 ， 是 用 from...import 完 成 的 。 


from tornado.options import define, options 


define("port", default=8000, help="run on the given port", type=int) 
这 两 句 束 显 示 了 所 谓 “ 命 令 行 解析 模块 "的 用 途 了 。 


通过 tornado.options.define0 定 义 了 访问 本 服务 问 的 端口 ， 束 是 当 在 浏 
贤 右 地 址 栏 中 输入 http:localhost:8000 的 时 候 ， 才 能 访问 本 网 站 ， 因 为 
http 协 议 默认 的 端口 是 80， 为 了 区 分 ， 在 这 里 设置 为 8000， 为 什么 要 
区 分 呢 ? 因为 我 的 计算 机 已 经 部 署 了 别 的 (或许 是 Nginx、Apache) 
服务 右 了 ， 它 的 端口 是 80， 所 以 要 区 分 开 ， 并 且 ， 如 有 果 将 Tomado 和 
Nginx 联 合 起 来 工作 ， 两 个 服务 右 在 同一 台 计 算 机 上 ， 就 要 分 开 (天 于 
两 者 联合 工作 ， 可 以 到 网 上 搜索 并 参考 有 天 Tornado 部 署 的 资料 ) 。 


2. 定 义 请 求 -处 理 程序 类 


class IndexHandler(tornado.web.RequestHandler): 


def get(self): 


greeting = self.get_argument('greeting', 'Hello') 


Self.write(greeting + ', welcome you to read: www.itdiffer.com') 


所 谓 “ 请 求 处 理 * 程 序 类 ， 束 古 要 定义 一 个 类 ， 专 | ] 应 付 客 户 端 癌 服 务 
器 提出 的 请 求 (这 个 请 求 也 许 是 要 读 取 某 个 网 页 ， 也 许 是 要 将 某 些 信 
县 存 到 服务 器 上 ) ， 服 务 器 要 有 相应 的 程序 来 接收 并 处 理 这 个 请 求 ， 
并 且 反 馈 某 些 信息 (或 者 是 针对 请 求 反 馈 所 要 的 信息 ， 或 者 返回 其 他 


的 错误 信息 等 ) 


于 是 ， 就 定义 了 一 个 类 ， 名 字 是 IndexHandler， 名 字 可 以 随便 取 ， 但 
征 ， 按 照 习 惯 类 名 的 单词 首 字 母 都 是 大 写 的 ， 并 且 如 采 这 个 类 十 请 求 
处 理 程序 类 ， 那 么 最 好 用 Handler 结 尾 ， 这 样 在 名 称 上 很 明确 ， 望 文生 
义 ， 知 道 是 干什么 的 。 


类 IndexHandler 继 承 tornado.web.RequestHandler， 其 中 再 定义 getO0 和 
post() 两 个 在 Web 中 应 用 最 多 的 方法 的 内 容 。 


在 本 例 中 ， 只 定义 了 一 个 get0 方 法 。 


用 greeting=self.get_argument (greeting'，'Hello') 的 方式 可 以 得 到 url 中 
传递 的 参数 ， 比 如 : 


$ curl http://localhost:8000/?greeting=Qiwsir 


Qiwsir, welcome you to read: www.itdiffer.com 


得 到 了 在 unl 中 为 greeting 设 定 的 值 Qiwsir。 如 果 url 中 没有 提供 值 ， 就 是 
Hello ° 


官方 文档 对 这 个 方法 的 描述 如 下 : 
RequestHandler.get_argument(name, default=,[ ]strip=True) 
Returns the value of the argument with the given name. 


If default is not provided, the argument is considered to be required, and we 
raise a MissingArgumentError if it is missing. 


If the argument appears in the url more than once, we return the last value. 


The returned value is always unicode. 


接 下 来 的 那 句 self.write (greeting+'"，weblcome you to 
read:www.itdiffer.com) ' 中 ，write0 方 法 的 主要 功能 是 癌 客 尸 问 反馈 信 
居 。 也 浏览 一 下 官方 文档 信息 ， 对 以 后 的 正确 理解 使 用 有 帮助 : 
RequestHandler.write(chunk)[sourcel] 

Writes the given chunk to the output buffer. 


To write the output to the network,use the flush() method below. 


If the given chunk is a dictionary,we write it as JSON and set the Content- 
Type of the response to be application/json. (if you want to send JSON asa 
different Content-Type,call set_header after calling write()). 


Sun0O 方 这 

计 _name ==" main "这 个 方法 跟 以 往 执 行 Python 程序 是 一 样 的 。 
tornado.options.parse_command_line()， 这 是 在 执行 Tornado 的 解析 命令 
行 。 在 Tornado 的 程序 中 ， 只 要 import 模 块 之 后 ， 束 会 在 运行 的 时 候 目 
动 加 载 ， 不 需要 了 解 细 方 ， 但 是 ， 在 main() 方 法 中 如 果 有 命令 行 解 

析 ， 必 须 提前 将 模块 引入 。 

4.Application 类 


下 面 这 人 句 征 重点 : 


app = tornado.web.Application(handlers=[(r"/", IndexHandler)]) 


将 tornado.web.Application 类 实例 化 。 这 个 实例 化 ， 本 质 上 是 建立 了 整 
个 网 站 程序 的 请 求 处 理 集合 ， 然 后 它 可 以 被 HTTPServer 作 为 参数 调 
用 ， 实 现 http 协 议 服 务 器 访问 。Application 类 的 _init 方法 参数 形 
Rs 

def _ init_ (self, handlers=None, default_host="", transforms=None,**settings): 


pass 


在 一 般 情况 下 ，handlers 是 不 能 为 空 的 ， 因 为 Application 类 要 通过 这 个 
参数 的 值 处 理 来 自 客户 端的 请 求 。 例 如 在 本 例 中 ，handlers=[ (r"/"， 


IndexHandler) ]， 就 意味 痢 如 有 末 通 过 浏览 器 的 地 址 栏 输入 根 路 径 
(http://localhost:8000 束 是 根 路 径 ， 如 果 是 http://localhost:8000/qiwsir， 
就 不 属于 根 ， 而 是 一 个 子路 径 或 目录 了 ) ， 对 应 着 就 是 让 IndexHandler 

类 人 处理 这 个 请 求 。 


一 定 要 注意 通过 handlers 传 入 的 数值 格式 ， 等 到 后 面 做 复杂 结构 的 网 站 
时 ，handlers 忠 显得 重要 了 。 它 传 入 的 古 一 个 列表 ， 列 表 里 面 的 元 素 是 
元 组 ， 元 组 的 组 成 包括 两 部 分 ， 一 部 分 是 请 求 路 径 ， 男 外 一 部 分 是 处 
理 程序 的 类 名 称 。 注 意 请 求 路 径 可 以 用 正则 表达 式 书 写 (关于 正则 表 
达 式 ， 后 面 会 进行 简要 介绍 ) 。 举 例 说 明 : 


handlers = [ 


(r"/", IndexHandlers), # 来 自 根 路 径 的 请 求 用 IndesHandlers 处 理 


(r"/qiwsir/(.*)", QiwsirHandlers), # 来 自 /qiwsir/ 以 及 其 下 任何 请 求 
#QiwsirHandlers 处 理 
] 


在 这 里 我 使 用 了 r"/" 的 样式 ， 意 味 着 束 不 需要 使 用 转 义 符 ，r 后 面 的 都 

表示 该 符号 本 来 的 含义 。 例 如 ，\n， 如 果 单 纯 这 么 来 使 用 ， 就 意味 着 

换行 ， 因 为 符号 “具有 转 义 功能 ， 当 写成 rn" 的 形式 时 ， 就 不 再 表示 

换行 了 ， 而 是 两 个 字符 ，\ 和 mn， 不 会 转 意 。 一 般 情 况 下 ， 由 于 正则 表 

0 因此 ， 当 一 个 字符 串 使 用 了 正则 表达 式 后 ， 最 好 使 
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天 于 Application 类 的 介绍 ， 告 一 段落 ， 还 有 别 的 参数 设置 没有 讲 ， 请 
保持 耐心 继续 阅读 后 续 内 容 。 


5.HTTPServer 类 


实例 化 之 后 ，Application 对 象 (用 app 作 为 标签 的 ) 就 可 以 被 另外 一 个 
类 HTTPServer 引 用 ， 形 式 为 : 


http_server = tornado .httpserver . HTTPServer (app) 


HTTPServer 是 tornado.httpserver 里 面 定义 的 类 。HTTPServer 是 一 个 单线 

程 非 阻 塞 HTTP 服 务 器 ， 执 行 HITTPServer 一 般 要 回调 Application 对 象 

并 提供 发 送 啊 应 的 接口 ， 即 下 面 的 内 容 是 跟随 上 面 语句 的 
(options.port 的 值 在 IndexHandler 类 前 面 通过 from...import.. 设 置 ) 。 


http_server.listen(options.port) 


这 种 方法 ， 束 建立 了 单 进程 的 http 服 务 。 

请 读者 牢记 ， 如 有 果 在 以 后 的 编码 中 ， 遇 到 需要 多 进程 ， 请 参考 官方 文 
档 说 明 : http://tornado.readthedocs.org/en/latest/httpserver.html#http- 
server ° 

6.IOLoop 类 

剩 下 最 后 一 句 本: 


tornado .ioloop.IOLoop.instance().start() 


这 人 句 话 ， 总 是 在 _main(0) 的 最 后 一 句 。 暂 时 不 对 这 里 的 instance0 和 
start() 做 深入 研究 (如 果 你 去 人 研究 start()， 肯 定 会 有 点 突然 的 感觉 ) 


以 上 是 一 个 简单 的 hello.py 放 析 。 想 必 读 者 对 Tornado 编 写 网 站 的 基本 
概念 已 经 了 解 了 。 


如 果 还 一 头 雾 水 ， 也 不 要 着 急 ， 只 需要 有 一 个 整体 概念 ， 不 要 拘泥 于 
细节 或 者 某 些 词汇 含义 ， 然 后 即 继续 学 习 。 


8.3 ”做 个 简单 的 网 站 

从 现在 开始 做 一 个 网 站 ， 当 然 ， 这 个 网 站 只 能 算是 一 个 毛坯 的 ， 可 能 
很 徐 陋 ， 但 是 网 站 的 主要 元 素 都 会 涉及 ， 读 者 通过 此 学 习 ， 能 够 了 解 
网 站 的 开发 基本 结构 和 内 容 ， 并 且 对 前 面 的 知识 可 以 有 综合 应 用 。 
8.3.1 基本 结构 

如 图 8-3 所 示 是 一 个 网 站 的 基本 结构 。 
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图 8-3 ”网 站 的 基本 结构 
1. 前 端 


这 是 一 个 不 很 严格 的 说 法 ， 但 是 在 日 常 开 发 中 都 这 么 说 。 在 网 站 中 ， 
所 谓 前 端 就 是 指 用 浏览 器 打开 之 后 看 到 的 那 部 分 ， 它 呈现 网 站 传 过 来 
的 信息 的 界面 ， 也 是 用 户 和 网 站 之 间 进 行 信息 交互 的 界面 。 扬 写 前 
端 ， 一 般 使 用 HTML/CSS/JS， 当 然 ， 非 要 用 Python 也 不 是 不 可 以 ( 例 
人 ， 但 这 势必 造成 以 后 维护 困 
难 o 


MVC 模 式 十 一 个 非常 好 的 软件 染 构 模式 ， 在 网 站 开发 中 ， 也 党 第 要 求 
遵守 这 个 模式 。 请 阅读 维基 百科 的 解释 : 


MVC 模 式 (Model-View-Controller) 是 软件 工程 中 的 一 种 软件 架构 模 
式 ， 把 软件 系统 分 为 三 个 基本 部 分 : 模型 (Model) 、 视 图 (View) 
和 控制 各 (Controller) 。 


MVC 模 式 最 早 由 Trygve Reenskaug 在 1978 年 提出 ， 是 施乐 帕 罗 奥 多 人 研 
究 中 心 (Xerox PARC) 在 20 世 纪 80 年 代为 程序 语言 Smalltalk 发 明 的 一 
种 软件 设计 模式 。MVC 模 式 的 目的 是 实现 一 种 动态 的 程式 设计 ， 使 后 
续 对 程序 的 修改 和 扩展 人 简化， 并且 使 程序 某 一 部 分 的 重复 利用 成 为 可 
能 。 除 此 之 外 ， 此 模式 通过 对 复杂 上 度 的 简化 ， 使 程序 结构 更 加 直观 。 
软件 系统 通过 对 目 身 基本 部 分 分 离 的 同时 也 赋予 了 各 个 基本 部 分 应 有 
的 功能 。 专 业 人 员 可 以 通过 目 寻 的 专长 分 组 。 


。 控制 人 (Controller) : 负责 转发 请 求 ， 对 请 求 进行 处 理 。 
。 视 图 (View) : 界面 设计 人 员 进 行 图 形 界 面 设计 。 


。 模型 (Model) : 程序 员 编 写 程序 应 有 的 功能 〈 实 现 算 法 等 ) 、 
2 0 (可 以 实现 具体 的 功 
能 ) 。 


所 谓 “ 前 疾 "， 大 概 对 应 着 View 部 分 ， 之 所 以 说 是 大 概 ， 因 为 MVC 是 站 
在 一 个 软件 系统 的 角度 进行 划分 的 ， 图 8-2 中 的 前 后 端 ， 与 其 说 是 系统 
部 分 的 划分 ， 不 如 说 是 系统 功能 的 划分 。 


前 端 所 实现 的 功能 主要 有 : 


。 呈现 内 容 。 这 些 内 容 是 根据 URL， 由 后 端 从 数据 库 中 提取 出 来 
的 ， 发 送 给 前 器， 然后 前 器 将 其 按照 一 定 的 样式 皇 现 出 来 。 另 
外 ， 有 一 些 内 容 不 是 后 端 数据 库 提 供 的 ， 是 写 在 前 端的 。 

。 用户 与 网 站 交互 。 比 如 用 户 登 录 ， 这 是 很 多 网 站 都 有 的 功能 ， 当 
用 户 在 指定 的 输入 框 中 输入 信息 之 后 ， 该 信息 就 古 说 前 端 提交 给 
后 端 ， 后 端 对 这 个 信息 进行 处 理 ， 一 般 情 况 下 都 要 再 反馈 给 前 端 
一 个 处 理 结 采 ， 然 后 前 端 主 现 给 用 户 。 


2. 后 端 


这 里 所 说 的 后 端 对 应 着 MVC 中 的 Controller 和 Model 的 部 分 或 者 全 部 功 
因为 在 图 8-2 中 , “后 端 ?是 一 个 狭 隆 的 概念 ， 没 有 把 数据 库 放 在 其 


不 在 这 些 术 语 上 纠结 。 
后 端 就 是 用 Python 写 的 程序 ， 主 要 任务 是 根据 需要 处 理由 前 端 发 过 来 
的 各 种 请 求 ， 然 后 根据 逻辑 流程 操作 数据 库 (对 数据 库 进 行 增删 改 
查 ) ， 或 者 把 请 求 的 处 理 结果 反馈 给 前 端 ， 还 可 能 二 者 兼 有 之 。 

3. 数 据 库 

工作 比较 单一 ， 就 是 面 对 后 端的 Python 程序 ， 任 其 增删 改 查 。 

8.3.2 ”一 个 基本 架势 


我 们 已 经 制作 了 一 个 只 显示 一 行 字 的 网 站 ， 该 网 站 由 于 功能 太 单 一 ， 
把 所 有 的 东西 都 写 到 一 个 文件 中 。 在 真正 的 工程 开发 中 ， 如 采 那 么 


做 ， 那 么 开发 过 程 和 后 期 维护 会 遇 到 麻烦 ， 特 别 是 不 便于 多 人 合作 。 
所 以 ， 要 做 一 个 基本 框架 ， 以 后 网 站 就 在 这 个 框架 中 开发 。 


建立 一 个 目录 ， 在 这 个 目录 中 建立 一 些 子 目 录 和 文件 。 


handlers 


methods 


statics 


| 

templates 

| 
application.py 


server.py 


| 
url.py 


这 个 结构 建立 好 ， 就 摆 开 了 一 个 做 网 站 的 架势 。 有 了 这 个 架势 ， 后 面 
的 事情 就 是 在 这 个 基础 上 添加 具体 内 容 。 当然， 还 可 以 用 另外 一 个 更 
好 听 的 名 字 一 设计 。 


依次 说 明 上 面 的 架势 中 每 个 目录 和 文件 的 作用 (当然 ， 这 个 作用 是 我 
规定 的 ， 如 果 读 者 愿意 ， 也 可 以 根据 自己 的 意愿 来 任意 设计 ) 。 


。 handlers: 我 准备 在 这 个 文件 夹 中 放 后 端 python 程 序 ， 主 要 处 理 来 
目前 端的 请 求 ， 并 且 操 作 数 据 库 。 

。 methods: 这 里 准备 放 一 些 函 数 或 者 类 ， 比 如 用 得 最 多 的 读 写 数据 
库 的 函数 ， 这 些 函 数 被 handlers 里 面 的 程序 使 用 。 

。 这 里 准备 放 一 些 静态 文件 ， 比 如 图 片 、css 和 JavaScript 文 
件 等 。 

。 0 这 里 放 模 板 文件 ， 都 以 html 为 扩展 名 ， 它 们 将 直接 面 
天 由 


另外 ， 还 有 三 个 Python 文件 ， 依 次 写 下 如 下 内 容 。 这 些 内 容 的 功能 ， 
已 经 讲 过 ， 只 是 这 里 进行 分 门 别 类 。 


1.url.py 文 件 


#!/usr/bin/env python 


# coding=utf-8 

the Url structure of website 

import sys 

reload(sys) 
sys.setdefaultencoding("utf-8") 

from handlers.index import IndexHandler 
url=[ 


(r'/', IndexHandler), 


] 


url.py 文 件 主 要 设置 网 站 的 目录 结构 。from handlers.index import 
IndexHandler， 虽 然 在 handlers 文 件 夹 还 没有 什么 东西 ， 为 了 演示 如 何 
建立 网 站 的 目录 结构 ， 假 设 在 handlers 文 件 夹 里 面 已 经 有 了 一 个 文件 
index.py， 它 里 面 还 有 一 个 类 IndexHandler。 在 url.py 文 件 中 ， 将 其 引用 
过 来 。 


变量 URL 指 同一 个 列表 ， 在 列表 中 列 出 所 有 目录 和 对 应 的 处 理 类 。 比 
如 (r，IndexHandler) ， 束 是 约定 网 站 根 目 好 的 处 理 类 是 
IndexHandler， 即 来 目 这 个 目 孙 的 get0 或 者 postO 请 求 ， 均 有 
IndexHandler 类 中 相应 的 方法 来 处 理 。 


如 有 果 还 有 别 的 目录 ， 如 法 炮制 。 


2.application.py 文 件 


#!/usr/bin/env python 


# coding=utf-8 
from url import url 


import tornado.web 


import os 


settings = dict( 
template_path = os.path.join(os.path.dirname(_ file ), "templates"), 


static_ path = os.path.join(os.path.dirname(_ file ), "statics") 


) 


application = tornado.web.Application( 
handlers = url, 
**settings 


) 


从 内 容 中 可 以 看 出 ， 这 个 文件 完成 了 对 网 站 系统 的 基本 配置 ， 建 立 网 
站 的 请 求 处 理 集合 。 


from url import url 是 将 url.py 中 设 定 的 目录 引用 过 来 。 


setting 引 用 了 一 个 字典 对 象 ， 里 面 约 定 了 模板 和 静态 文件 的 路 径 ， 即 
a J 文件 夹 *templates” 和 ”statics” 分 别 为 模板 目 永 和 静态 文 
= 


接 下 来 application 束 是 一 个 请 求 处 理 集合 对 象 。 请 注意 
tornado.web.Application() 的 参数 设置 : 


tornado .web .Application(handlers=None, default_host='', transforms=None, **settings) 


天 于 settings 的 设置 ， 不 仅仅 是 文件 中 的 两 个 参数 ， 还 可 以 有 其 他 ， 比 
如 ， 如 果 填 上 debug=True 束 表示 处 于 调试 模式 。 调 试 模式 的 好 处 是 开 
发 时 调试 方便 ， 但是， 在 正式 部 署 的 时 候 ， 最 好 不 要 用 调试 模式 。 其 
他 更 多 的 settings 可 以 参看 官方 文档 : tornado.web-RequestHandler and 

Application classes (http://tornado.readthedocs.org/en/latest/web.html) 。 


3.server py 文件 
这 个 文件 的 作用 是 将 tornado 服 务 需 运行 起 来 ， 并 且 宫 括 前 面 两 个 文件 
中 的 对 象 属 性 设置 。 


#!/usr/bin/env python 


# coding=utf-8 

import tornado.ioloop 
import tornado .options 
import tornado.httpserver 


from application import application 


from tornado.options import define, options 


define("port", default = 8000，help = "run on the given port", type = int) 
def main(): 

tornado .options.parse_command_line() 

http_server = tornado.httpserver .HTTPServer(applLication) 


http_server .listen(options .port) 


print "Development Server is running at http://127.0.0.1:%s" % options .port 


print "Quit the Server with Control-C" 


tornado .ioloop.IOLoop.instance().start() 


if name. == "main__" 


main() 


如 此 这 般 ， 束 完成 了 网 站 染 势 的 搭建 ， 下 面 要 做 的 是 同 里 面 添 加 内 


容 。 
8.3.3 ”连接 数据 库 


网 站 不 一 定 非 要 有 数据 库 ， 但 是 如 果 做 一 个 功能 强悍 的 网 站 ， 数 据 库 
忠 古 必需 的 了 。 

接 下 来 的 网 站 ， 和 暂且 采用 MySQL 数 据 库 。 

在 前 面 已 经 搭建 的 目 孙 结构 中 ， 找 到 methods， 并 建立 一 个 文件 
db.py， 然 后 分 别 建立 起 连接 对 象 和 游标 对 象 。 代 码 如 下 : 


#!/usr/bin/env python 


# coding=utf-8 
import MySQLdb 


conn = MySQLdb.connect(host="localhost", user="root", passwd="123123", db="qiwsirtest", port=3306, charset="utf8") 


cur = conn.cursor() 


8.3.4 ”登录 界面 


人 
JU 


当 用 户 输入 网 址 ， 呈 现在 眼前 的 是 一 个 登录 界面 。 在 用 户 名 和 密码 两 
个 输入 框 中 分 别 输入 正确 的 用 户 名 和 密码 之 后 ， 单 击 确定 按钮 ， 登 录 
网 站 ， 显 示 对 该 用 户 的 欢迎 信息 。 


用 图 示 来 说 明 ， 如 图 8-4 所 示 。 


用 尸 登录 界面 
用 户 名 :+ 
密 码 :| 


| 登录 


尚未 注册 的 用 户 ， 请 注册 


图 8-4 用 户 登 录 界 下 


Re 经 过 验证 古 合 法 用 户 之 后 ， 束 呈现 如 图 8-5 所 示 


欢迎 xxx 
你 已 经 成 功 登录 本 站 


人 生 百 短 


请 学 python 


图 8-5 “呈现 界 下 


先 用 HTML 写 好 第 一 个 界面 。 进 入 到 templates 文 件 ， 建 立 名 为 
index.html 的 文件 : 


<!DOCTYPE html> 


<head> 
<meta charset="UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1" /> 
<title>Learning Python</title> 
</head> 
<body> 
<h2>Login</h2> 
<form method="POST"> 


<p><span>UserName:</span><input type="text" id="username"/></p> 


<p><span>Password:</span><input type="password" id="password" /></p> 


<p><input type="BUTTON" value="LOGIN" id="login" /></p> 


这 是 一 个 很 答 单 的 前 端 弄 面 。 要 特别 关注 <meta 
name="viewport"content="width=device-width ，initial-scale=1"/>， 其 目 
的 在 于 将 网 页 的 默认 宽度 (viewport) 设置 为 设备 的 屏幕 宽度 

(width=device-width) ， 并 且 原 始 缩放 比例 为 1.0 (initial-scale=1) ， 
即 网 页 初始 大 小 占 屏幕 面积 的 100%。 这样 做 的 目的 是 让 其 在 电脑 、 手 
机 等 不 同 大 小 的 屏幕 上 ， 都 能 很 好 地 显示 。 


这 种 样式 的 网 页 是 “ 目 适 应 页 面 *。 当然 ， 目 适应 页 面 绝 非 是 仅仅 有 这 

样 一 行 代码 就 完全 解决 的 。 要 设计 目 适 应 页 面 ， 束 是 要 进行 “响应 式 设 
计 ”， 还 需要 对 CSS、JS 乃 至 于 其 他 元 素 如 表格 、 图 片 等 进行 设计 ， 或 
者 使 用 一 些 啊 应 式 设计 的 框 染 。 


一 提 到 能 够 在 手机 上 显示 ， 读 者 是 否 想到 了 HTML5 呢 ， 这 个 被 一 些 人 
ee 好 庸 置疑 ， 现 在 已 经 得 到 了 越 来 越 广 
泛 的 应 用 。 


HTML5 是 HTML 最 新 的 修订 版 本 ，2014 年 10 月 由 万 维 网 联盟 (W3C) 
完成 标准 制定 。 目 标 是 取代 1999 年 所 制定 的 HIML 4.01 和 XHTML 1.0 
标准 ， 以 期 能 在 互联 网 应 用 迅速 发 展 的 时 候 ， 使 网 络 标准 达到 符合 当 
代 的 网 络 需求 。 广 义 论 及 HTML5 时 ， 实 际 指 的 是 包括 HTML 、CSS 和 
JavaScript 在 内 的 一 套 技 术 组 合 。 


响应 式 网 页 设计 (英语 : Responsive Web Design， 通 常 缩写 为 

RWD) ， 勾 被 称 为 自 适应 网 页 设计 、 回 应 式 网 页 设计 。 是 一 种 网 页 设 
计 的 技术 做 法 ， 该 设计 可 使 网 站 在 多 种 浏览 设备 (从 虽 面 电脑 显示 器 
I 上 阅读 和 导航 ， 同 时 减少 缩放 、 平 
多 和 滚动 。 


可 以 直接 用 浏览 万 打开 网 页 ， 因 为 它 和 是 .html 格 式 的 文 


虽然 完成 了 视觉 上 的 设计 ， 但 是 ， 如 果 单 击 login 按 钮 ， 没 有 任何 反 
应 。 因 为 它 还 仅仅 是 一 个 孤立 的 页 面 ， 这 时 候 需 要 一 个 前 端 交 互利 右 
JavaScript ° 


对 于 JavaScript， 不 少 人 对 它 有 误解 ， 总 认为 它 是 从 Java 演 化 出 来 的 。 
它们 两 个 有 相像 的 地 方 ， 但 其 关系 就 如 同 “ 雷 峰 塔 和“ 雷锋” 一样。 详 
细 读 一 读 来 自 维 基 百 科 的 诠释 。 


JavaScript， 一 种 直译 式 脚本 语言 ， 是 一 种 动态 类 型 、 弱 类 型 、 基 于 原 
型 的 语言 ， 内 置 文 持 类 。 它 的 解释 器 锌 称 为 JavaScript 引 擎 ， 为 浏览 絮 
的 一 部 分 ， 广 泛 用 于 客户 端的 脚本 语言 ， 最 早 是 在 HTML 网 页 上 使 
用 ， 用 来 给 HTML 网 页 增加 动态 功能 ， 然 而 现在 也 可 以 被 用 于 网 络 服 
务 器 ， 如 Node.js。 


在 1995 年 时 ， 由 网 景 公 司 的 布 兰 登 . 艾 克 ， 在 网 景 导 航 者 浏览 器 上 首次 
设计 实现 而 成 。 因为 网 景 公司 与 异 阳 公司 合作 ， 网 景 公司 管理 层 希 望 
它 外 观看 起 来 像 Java， 因 此 取 名 为 JavaScript。 但 实际 上 它 的 语义 与 
Self 及 Scheme 较为 接近 。 


为 了 获取 技术 优势 ， 微 软 推出 了 JScript， 与 JavaScript 同 样 可 在 浏览 器 
上 运行 。 为 了 统一 规格 ，1997 年 ， 在 ECMA (欧洲 计算 机 制造 商 协 
会 ) 的 协调 下 ， 由 网 景 、 异 阳 、 微 软 和 Borland 公 司 组 成 的 工作 组 确 害 
统一 标准 : ECMA-262。 因 为 JavaScript 兼 容 于 ECMA 标 准 ， 因 此 也 称 
为 ECMAScript 。 


但 是 ， 我 更 喜欢 用 jQuery， 因 为 它 的 确 让 我 省 了 不 少 事 。 


jQuery 是 一 套 跨 浏览 器 的 JavaScript 库 ， 可 以 和 帘 化 HITML 与 JavaScript 之 
间 的 操作 。 由 约翰 : 雷 西 格 (John Resig) 于 2006 年 1 月 在 BarCamp NYC 
上 发 布 第 一 个 版 本 。 目 前 是 由 Dave Methvin 领 导 的 开发 团队 进行 开 
发 。 在 全 球 前 10，000 个 访问 最 高 的 网 站 中 ， 有 65% 使 用 了 jQuery， 是 
目前 最 受 欢 迎 的 JavaScript 库 。 


在 index.html 文 件 中 引入 jQuery 的 方法 有 多 种 。 

原则 上 ， 可 以 在 HIMEL 文 件 的 任何 地 方 引 入 jQuery 库 ， 但 是 通常 放置 
的 地 方 在 htm]l 文 件 的 开头 <head>...</head> 中 ， 或 者 在 文件 的 来 尾 
</body> 以 内 。 若 放 在 开头 ， 如 果 所 用 的 库 比 较 大 、 比 较 多 ， 在 载 入 页 
面 时 的 时 间 相对 较 长 。 


第 一 种 引入 方法 是 国际 化 的 一 种 : 


<script src="http://ajax.googleapis.com/ajax/libs/jquery/1.11.2/jquery.min.js"></script> 


这 是 直接 从 jQuery CDN (Content Delivery Network) 上 直接 引用 ， 好 
处 在 于 如 果 这 个 库 更 新 ， 你 不 用 做 任何 操作 ， 就 直接 使 用 最 新 的 了 。 


当然 ，jQuery CDN 不 止 一 个 ， 比 如 官方 网 站 的 : <script 


src="//code.jquery.com/jquery-1.11.3.min.js"></script> ° 


第 二 种 引入 方法 是 将 jQuery 下 载 下 来 ， 放 在 指定 地 方 (比如 ， 与 自己 
的 网 站 在 同一 个 存储 器 中 ， 或 者 自己 可 以 访问 的 另外 服务 器 ) 。 到 官 
方 网 站 https:Wjqueryui.com/) 下 载 最 新 的 库 ， 然 后 将 它 放 在 已 经 建立 
的 statics 目 录 内 ， 为 了 更 清楚 地 区 分 ， 可 以 在 里 面 建立 一 个 子 目 录 js， 
jQuery 库 放 在 js 子 目录 里 面 。 下 载 的 时 候 ， 建 议 下 载 以 min.js 结 尾 的 文 
件 ， 因 为 这 个 是 经 过 压缩 之 后 的 ， 体 积 小 。 


我 在 statics/js 目 好 中 放置 了 下 载 的 库 ， 并 日 为 了 人 简短， 更 名 为 


jquery.min.js ° 


可 以 用 下 面 的 方法 引入 : 


<script src="statics/js/jquery.min.js"></script> 


如 果 这 样 写 也 是 可 以 的 ， 但 是 考虑 到 Tornado 的 特点 ， 用 下 面 的 方法 引 
入 更 具有 灵活 性 : 


<script src="{{static url("js/jquery.min.js")}}"></script> 


不 仅 要 引入 jQuery， 还 需要 引入 目 己 写 的 js 指令 ， 所 以 要 建立 一 个 文 
我 命名 为 scriptjs， 也 同时 引用 过 来 ， 虽 然 目前 这 个 文件 还 是 空 


<script src="{{static url("js/script.js")}}"></script> 


这 里 用 的 static_url0 是 Tornado 模 板 提 供 的 一 个 画 数 ， 用 这 个 函数 ， 能 
人 够 制定 静态 文件 。 之 所 以 用 它 ， 而 不 是 用 上 面 的 那 种 直接 调用 的 方 
法 ， 主 要 原因 是 如 果 某 一 天 ， 将 静态 文件 目录 statics 修 改 了 ， 即 不 指定 
statics 为 静态 文件 目录 了， 定义 别 的 目录 为 静态 文件 目录 。 只 需要 在 定 
义 静 态 文 件 目录 那里 修改 ， 而 其 他 地 方 的 代码 不 需要 修改 。 


先 写 一 个 测试 性 质 的 东西 。 


2 编辑 絮 打 开 statics/js/script.jjs 文 件 ， 如 果 没 有 就 新 建 。 输 入 的 代码 如 


$(document).ready(function(){ 
alert("good"); 
$("#1l0gin").click(function(){ 
var user = $("#username").val(); 
var pwd = $("#password").val(); 
alert("username: "+user); 
}); 
}); 


由 于 本 书 不 是 专门 讲授 JavaScript 或 者 jQuery， 所 以 ， 在 js 代码 部 分 
只 能 一 带 而 过 ， 不 详细 解释 。 


上 面 的 代码 主要 实现 获取 表单 中 的 id 值 分 别 为 username 和 password 输 入 
的 值 ，alert 函 数 的 功能 是 把 值 以 弹出 染 单 的 方式 显示 出 来 。 


是 否 还 记得 url.py 文 件 ? 做 这 样 的 设置 : 


from handlers.index import IndexHandler 


url=[ 
(r'/', IndexHandler), 


] 


现在 把 假设 有 了 的 那个 文件 index.py 建 立 起 来 ， 即 在 handlers 里 面 建立 
index.py 文 件 ， 并 写 入 如 下 代码 : 


#!/usr/bin/env python 


# coding=utf-8 
import tornado.web 


class IndexHandler(tornado.web.RequestHandler): 
def get(self): 


self.render("index.html") 


当 访 问 根 目录 的 上 时候， 就 将 相应 的 请 求 交 给 了 handlers 日 录 中 index.py 
文件 的 IndexHandler 类 的 get() 方 法 来 处 理 ， 它 的 处 理 结果 呈现 
index.html 模 板 内 容 。 


render() 函 数 的 功能 在 于 同 请 求 者 反馈 网 页 模板 ， 并 且 可 以 同 模板 中 传 


递 数 值 。 


将 上 面 的 文件 保存 之 后 ， 回 到 handlers 目 录 中 。 因 为 这 里 面 的 文件 要 在 
别处 被 当 作 模块 引用 ， 所 以 ， 需 要 在 这 里 建立 一 个 空 文件 ， 命 名 为 

_init _.py。 这 个 文件 非常 重要 。 只 要 在 目录 中 加 入 了 这 个 文件 ， 该 
目录 中 的 其 他 . py 文件 融 可 以 作为 模块 被 Python | 入 了 。 


至 此 ， 一 个 带 有 表单 的 网 站 就 建立 起 来 了 。 读 者 可 以 回 到 上 一 级 目录 
中 ， 找 到 server.py 文 件 ， 并 运行 它 : 


Development server is running at http://127.0.0.1:8000 
Quit the server with Control-C 


如 时 读者 在 前 面 的 学 习 中 ， 跟 我 的 操作 完全 一 致 ， 台 会 在 shell 中 看 到 
上 上 面 的 结果 。 


打开 浏览 器 ， 输 入 http://localhost:8000 或 者 http://127.0.0.1:8000， 看 到 
的 应 该 如 图 8-6 所 示 。 


图 8-6 ”弹出 对 话 框 


这 就 是 script.js 中 的 “alert ("good") ;” 开 始 起 作用 了 ， 第 一 句 是 要 弹出 
一 个 对 话 框 。 单 击 “ 确 定 ” 按 钮 之 后 如 图 8-7 所 示 。 


图 


8-7 里 击 “ 


合 自 回 寺 全 全 沽 区 ，B 话 * 名 


确定 ”按钮 后 的 对 话 框 


在 这 个 页 面 输入 用 户 名 和 和 密码， 然后 单 击 Login 按 钮 ， 如 图 8-8 所 示 。 


图 


8-8 网 站 纵 形 


一 个 网 站 有 了 锥 形 。 不 过 ， 提 交 表 单 的 反应 ， 还 仪 仅 停留 在 客户 站 
且 没 有 问 后 端 传递 客户 端的 数据 信息 ， 接 下 来 束 解 决 这 个 问题 。 


8.3.5 ”数据 传输 


在 建立 了 前 端 表单 之 后 ， 就 要 实现 前 端 和 后 端 之 间 的 数据 传递 。 在 工 
程 中 ， 第 用 到 一 个 被 称 之 为 Ajax0 的 方法 。 


天 于 Ajax 的 故事 ， 需 要 浓墨重彩 ， 因 为 它 足够 精彩 。 


Ajax 是 “Asynchronous Javascript and XML” (异步 JavaScript 和 XML) 的 
缩写 ， 在 它 的 发 展 历程 中 ， 汇 集 了 众 家 贡献。 比如 微软 的 正 团队 曾经 
将 XHR (XML HttpRequest) 用 于 Web 浏 览 右 和 Web 服 务 器 间 传 输 数 
据 ， 并 且 被 W3C 标 准 采用 。 当 然 ， 也 有 其 他 公司 为 Ajax 技术 做 出 了 页 
献 ， 虽然 他 们 都 被 遗忘 了 ， 比 如 Oddpost， 后 来 被 Yahoo! 收购 并 成 为 
Yahoo! Mail 的 基础 。 但 是 ， 真 正 让 Ajax 大 放 异 彩 的 Google 是 不 能 被 名 
视 的 ， 正 是 Google 在 Gmail、Suggest 和 Maps 上 大 规模 使 用 了 Ajax， 才 
使 得 人 们 看 到 了 它 的 魅力 ， 程 序 员 由 此 而 兴 


技术 总 是 在 不 断 进化 的 ， 进 化 的 方向 就 是 用 着 越 来 越 方便 。 
回 到 jQuery， 里 面 就 有 Ajax() 方 法 ， 能 够 让 程序 员 方 便 地 调用 。 
Ajax() 方 法 通过 HTTP 请 求 加 载 远程 数据 。 

该 方法 是 jQuery 底层 AJAX 实 现 。 简 单 易 用 的 高 层 实现 如 $.get、$.post 


等 。$.ajax() 返 回 其 创建 的 XMLHttpRequest 对 象 。 大 多 数 情 况 下 你 无 须 
0 除非 你 需要 操作 不 常用 的 选项 ， 以 获得 更 多 的 灵活 


最 简单 的 情况 下 ，$.ajaxO 可 以 不 市 任何 参数 直接 使 用 。 


在 上 文 介绍 Ajax 的 时 候 ， 用 到 了 一 个 重要 的 术语 一 一 “ 寞 步 "， 与 之 相 
对 应 的 叫 作 “同步 "， 对 此 引用 来 目 阮 一 峰 的 网 络 日 志 中 的 通俗 摘 述 : 


“同步 模式 * 束 是 上 一 段 的 模式 ， 后 一 个 任务 等 得 前 一 个 任务 结束 ， 然 
后 再 执行 ， 程 序 的 执行 顺序 与 任务 的 排列 顺序 是 一 致 的 、 同 步 的 ; “ 腊 
步 模式 ” 则 完全 不 同 ， 每 一 个 任务 有 一 个 或 多 个 回调 函数 

(callback) ， 前 一 个 任务 结束 后 ， 不 是 执行 后 一 个 任务 ， 而 是 执行 回 
调 函 数 ， 后 一 个 任务 则 是 不 等 前 一 个 任务 结束 吏 执 行 ， 所 以 程序 的 执 
行 顺 序 与 任务 的 排列 顺序 是 不 一 致 的 、 有 异步 的 。 


“异步 模式 ”非常 重要 。 在 浏览 絮 逆 ， 耗 时 很 长 的 操作 都 应 该 异步 执 
行 ， 避 免 浏 览 釉 失去 啊 应 ， 最 好 的 例子 就 是 Ajax 操作 。 在 服务 大 
端 ,“ 寞 步 模式 ”甚至 是 唯一 的 模式 ， 因 为 执行 环境 是 单线 程 的 ， 如 采 
站 服务 右 性 能 会 急剧 下 降 ， 很 快 就 会 失去 
Hy ° 


看 来 ，Ajax0 征 前 后 端 进行 数据 传输 的 重要 角色 。 


承接 前 面 对 简 单 网 站 的 研发 ， 接 下 来 是 用 Ajax0 方 法 实现 前 后 端的 数 
据 传 输 ， 只 需要 修改 script.js 文 件 内 容 即 可 : 


$(documen t).ready(function(){ 


$("#1l0gin").click(function(){ 
ar user = $("#username").val(); 
var pwd = $("#password").val(); 
var pd = {"username":user, "password":pwd}; 
$.ajax({ 
type:"post", 
i 
data:pd, 
cache:false, 
success:function(data){ 
alert(data); 
}, 
error :function(){ 
ror!™" 


在 这 段 代 码 中 , “var pd={"username":user，"password":pwd}:;” 是 将 得 到 
的 user 和 pwd 值 ， 放 到 一 个 json 对 和 象 中 。 接 下 来 就 是 利用 Ajax() 方 法 将 
这 个 json 对 象 传 给 后 端 。 


jQuery 中 的 Ajax() 方 法 使 用 比较 简单 ， 正 如 上 面 的 代码 所 示 ， 只 需要 
$.ajax0 即 可 ， 不 过 需要 对 里 面 的 参数 进行 说 明 。 


。 type: 是 posti 不 是 get 。 

。 Url: post 或 者 get 的 地 址 。 

。 data: 传输 的 数据 ， 包 括 三 种 ， (1) html 拼 接 的 字符 串 ; (2) 
json 数 据 ; (3) form 表 单 经 serialize() 序 列 化 的 。 本 例 中 传输 的 就 


是 json 数 据 ， 这 也 是 经 常用 到 的 一 种 方式 。 

。 cache: 默认 为 True， 如 果 不 允 许 缓存 ， 设 置 为 False。 

。 success: 请 求 成 功 时 执行 回调 函数 。 本 例 中 ， 将 返回 的 data 用 alert 
方式 弹出 来 。 读 者 是 否 注意 到 ， 我 在 很 多 地 方 都 用 了 alert() 这 个 东 
目的 在 于 调试 ， 走 一 步 看 一 步 ， 看 看 得 到 的 数据 是 否 是 目 己 


Rs 
。 error: 请 求 失败 所 执行 的 函数 。 
8.3.6 ”数据 处 理 


前 端 通过 Ajax 技术 ， 将 数据 以 json 格 式 传 给 了 后 端 ， 并 且 指 明了 对 和 象 
目 孙 "/"， 这 个 目 孙 在 urlpy 文 件 中 已 经 做 了 配置 ， 是 由 handlers 目 孙 中 
index.py 文 件 的 mdexHandler 类 来 处 理 。 因 为 是 用 post 方 法 传 的 数据 ， 
那么 在 这 个 类 中 就 要 有 post 方 法 来 接收 数据 。 所 以 ， 要 在 IndexHandler 
类 中 增加 post()， 增 加 之 后 的 完善 代码 是 : 


#!/usr/bin/env python 


# coding=utf-8 
import tornado.web 


class IndexHandler(tornado.web.RequestHandler): 
def get(self): 


self.render("index.html") 


def post(self): 
username = self.get_ argument("username") 
password = self.get_argument("password") 


self .write(username ) 


在 post() 方 法 中 ， 使 用 get_argument() 函 数 来 授 收 前 端 传 过 来 的 数据 ， 这 
个 函数 的 完整 格式 是 get_argument (name,，default=[]，strip=True) ， 
它 能 够 获取 name 的 值 。 在 上 面 的 代码 中 ，name 束 是 从 前 端 传 到 后 端的 
那个 json 对 象 的 键 的 名 字 ， 是 哪个 键 就 获取 哪个 键 的 值 。 如 条 获取 不 
到 name 的 值 ， 束 返回 default 的 值 ， 但 是 这 个 值 默 认 是 没有 的 ， 如 果真 
的 没有 束 会 抛 出 HTTP 400。 竺 别 注意 ， 在 get 的 时 候 ， 通 过 
get_argument(O 函 数 获得 岂 的 参数 ， 如 宁 是 多 个 参数 ， 束 获取 最 后 一 个 
的 值 。 要 想 获取 多 个 值 ， 可 以 使 用 get_arguments name， 

strip=True) 


上 例 中 分 别 用 get_argument(0) 方 法 得 到 了 username 和 password， 并 且 它 
们 都 是 unicode 编 码 的 数据 。 


tornado.web.RequestHandler 的 方法 write0， 即 上 例 中 的 self.write 
(username) ， 是 后 端 向 前 端 返 回 数 据 。 这 里 返回 的 实际 上 是 一 个 字 
符 串 ， 也 可 返回 json 字 符 串 。 


如 果 读 者 要 查看 修改 代码 之 后 的 网 站 效果 ， 最 有 歼 的 方式 是 先 停 止 网 
站 (ctrltc) ， 再 重新 执行 python serverpy 运 行 网 站 ， 然 后 刷新 浏览 器 
即 可 。 这 是 一 种 较为 笨拙 的 方法 。 一 种 灵巧 的 方法 是 开启 调试 模式 。 
在 设置 setting 的 时 候 ， 写 上 debug=True 就 表示 是 调试 模式 了 。 但 是 ， 调 
2 如 果 修 改 模板 ， 就 不 会 加 载 ， 还 需要 重启 服 


看 看 上 面 的 代码 效果 ， 如 图 8-9 所 示 。 


| 家 | 自 回 时 全 全 的 村 "8 谣 " 和 ”三 


前 端 输入 了 用 户 名 和 密码 之 后 ， 单 击 login 按 钮 ， 提 区 给 后 端 ， 后 端 再 
回 前 端 返 回 数据 之 后 的 效果 。 这 吏 是 我 们 想 要 的 结果 。 


按照 流程 ， 用 户 在 前 端 输 入 了 用 户 名 和 密码 ， 并 通过 Ajax 提交 到 了 后 
端 ， 后 端 借助 于 get_argument(0) 方 法 得 到 了 所 提交 的 数据 (用 户 名 和 密 


1 。 下 面 要 做 的 事情 束 古 验证 这 个 用 户 名 和 密码 是 否 合法 ， 其 体现 
人 


。 数据 库 中 是 否 有 这 个 用 户 。 
。 密码 和 用 户 先 前 设 定 的 密码 (已 经 保存 在 数据 库 中 ) 是 否 匹配 。 


才能 允许 用 户 登 录 ， 登 孙 之 后 才能 继续 做 时 
= 情 


首先 ， 在 methods 目 录 中 (已 经 有 了 一 个 db.py) 创建 一 个 文件 ， 我 将 
其 命名 为 readdb.py， 专 门 用 来 存储 读数 据 用 的 函数 (这 种 划分 完全 是 
为 了 明确 和 演示 一 些 应 用 方法 ， 读 者 也 可 以 都 写 到 db.py 中 ) 。 这 个 文 
件 的 代码 如 下 : 


#!/usr/bin/env python 


# coding=utf-8 
from db import * 


def select_ table(table, column, condition, value ): 
sql = "select " + column + " from " + table + " where " + condition + "='" + Value + "'" 
cur.execute(sql) 
lines = cur.fetchall() 


return lines 


上 面 这 段 代码 ， 建 议 读 关 写 上 注释 ， 以 检验 目 己 是 否 能 够 将 以 往 的 知 
识 融 会 叶 通 地 应 用 。 


有 了 这 上 段 代 码 之 后 ， 束 进一步 改写 index.py 中 的 postO 方 法 。 为 了 明 
了 ， 将 index.py 的 全 部 代码 呈现 如 下 : 


#!/usr/bin/env python 


# coding=utf-8 


import tornado .web 


import methods .readdb as mrd 


class IndexHandler(tornado .web.RequestHandler ) : 
def get(self): 


Self.render("index.htm1") 


def post(self): 


username = self.get_argument("username") 


password = Self.get_argument("password'") 
user_infos = mrd.select_ table(table="users",column="*",condition="username", value=username) 
if user_infos: 
db_pwd = user_infos[9][2] 
if db_pwd == password: 
self.write("welcome you: " + Username) 
有 SG 
self.write("your password was not right.") 
二 


self.write("There is no thi user.") 


特别 注意 ， 在 methods 目 录 中 ， 只 有 不 缺少 init .py 文件 ， 才 能 在 
index.py 中 实现 import methods.readdb as mrd。 


代码 修改 到 这 里 ， 看 到 的 结 采 如 岁 8-10 所 示 。 


€ ,localhost:8000 - Search 家 自信 全 吕 严 v 家 ， 饭 v 三 


welcome you; qiwsir 


i 


图 8-10 ”修改 代码 的 结果 


如 图 8-11 所 示 是 正确 输入 用 户 名 (所 请 正确 ， 就 是 输入 的 用 户 名 和 密 
码 合法 ， 即 在 数据 库 中 有 该 用 户 名 ， 且 密码 匹配 ) ， 并 提交 数据 后 ， 
反馈 给 前 端的 欢迎 信息 。 


I€3 locathost'9000 v | G ||Q search 个 自 思 有 曼 全 下 总 六 ， 广 "名 lr 三 


your password was not right. 


图 8-11 ”欢迎 信息 
用 户 的 输入 是 最 不 可 靠 的 ， 或 许 会 出 现 多 种 情况 。 
如 图 8-12 所 示 是 输入 的 密码 错误 了 ， 前 端 反 馈 给 用 户 提示 的 信息 。 


€ Hlocalhost:Bo0n | & ||Q search | 六 和 自 思 入 人 合 目 过 嫩 * 本 话 * 虽 - 三 


There i no this user, 


图 8-12 


这 是 随意 输入 的 结果 ， 数 据 库 中 无 此 用 户 。 


上 述 演 示 中 ， 数 据 库 中 的 用 户 密 码 并 没有 加 密 ， 这 不 是 真实 的 开发 行 
为 ， 在 真实 的 开发 中 ， 一 定 要 加 密 传输 。 


8.3.7 ”模板 
网 站 做 到 现在 ， 突 然 发 现 ， 前 端 页 面 写 得 太 难 看 了 。 丛 话说 “外 行 看 热 


疝 ， 内 行 看 门道 ”。 程 序 员 写 的 网 站 ， 在 更 多 时 候 是 给 "外行 ”看 的 ， 他 
RN 他 们 看 的 束 是 界面 ， 因 此 把 界面 做 得 漂 党 一 


oO 


其 实 ， 也 不 仅仅 是 漂亮 的 原因 ， 而 且 前 端 页 面 还 要 显示 从 后 端 读 取 出 
来 的 数据 。 


恰好 ，Tornado 提 供 比 较 好 用 的 前 端 模 板 (tornado.template) ， 通 过 这 
个 模板 ， 能 够 让 前 端 编写 更 方便 。 


。 render() 


render() 方 法 能 够 告诉 Tornado 读 入 哪个 模板 ， 揪 入 其 中 的 模板 代码 ， 

并 返回 结果 给 浏览 器。 比如 在 IndexHandler 类 中 get() 方 法 里 面 的 

self.render ("index.html") ， 就 是 让 Tornado 到 templates 目 中 找到 名 为 

index.html 的 文件 ， 读 出 它 的 内 容 ， 返 回 给 浏 顺 右 。 这 样 用 户 残 能 看 到 

index.html 所 规定 的 页 面 了 。 前 面 所 写 的 index.html 仅 仅 是 html 标 记 ， 没 

人 出 所 谓 “ 模 板 * 的 作用 。 为 此 ， 将 index.html 和 index.py 文 件 做 如 
改造 。 


#!/usr/bin/env python 


# coding=utf-8 


import tornado.web 


import methods.readdb as mrd 


class IndexHandler(tornado.web.RequestHandler): 
def get(self): 
mes = mrd.select_columns(table="users",column="username") 
one_user = usernames [9][9] 


self.render("index.html", us 


er=one_user) 


index.py 文 件 中 ， 只 修改 了 get0 方 法 ， 从 数据 库 中 读 取 用 户 名 ， 并 且 提 
出 用 户 (one_user) ， 然 后 通过 self.render ("index.html", 


user=one_User) 将 这 个 用 户 名 放 到 index.html 中 ， 其 中 user=one_user 的 
作用 就 是 传递 对 象 到 模板 。 


要 提醒 读者 注意 的 是 ， 在 上 面 的 代码 中 ， 我 使 用 了 mrd.select_columns 
4table="users"，column='"username") ， 也 就 是 说 必须 要 在 methods 目 

孙 中 的 readdb.py 文 件 中 有 一 个 名 为 select_columns 的 函数 。 为 了 使 读者 

能 够 理解 ， 贴 出 已 经 修改 的 readdb.py 文 件 代 码 ， 比 上 一 顾 多 了 函数 


Select_columns: 


#!/usr/bin/env python 


# coding=utf-8 
from db import * 


def select_ table(table, column, condition, value ) : 
sql = "select " + Column + " from " + table + " where " + condition + "='" + Value + "'" 
cur.execute(sql) 


lines = cur.fetchall() 


return lines 


def select_ columns(table, column ): 
sql = "select " + column + " from " + table 
cur.execute(sql) 
lines = cur.fetchall() 


return lines 


下 面 是 index.html 修 改 后 的 代码 : 


<!DOCTYPE html> 
<head> 
<meta charset="UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1" /> 
<title>Learning Python</title> 
</head> 
<body> 
<h2> 登 录 页 面 </h2> 
<p> 用 用 户 名 为 ，{ {user}} 登 录 </p> 
<form method="POST"> 
<p><span>UserName:</span><input type="text" id="username"/></p> 
<p><span>Password:</span><input type="password" id="password" /></p> 
<p><input type="BUTTON" value=" 登 录 " id="login" /></p> 
</form> 
<script src="{{static url("js/jquery.min.js")}}"></script> 
<script src="{{static url("js/script.js")}}"></script> 


</body> 


“<p> 用 户 名 为 :，{{user}} 登 录 </p>”， 在 这 里 用 了 “{{}}* 方 式 接受 对 应 
的 变量 引用 的 对 象 。 即 在 首页 打开 之 后 ， 用 户 应 当 看 到 有 一 行 提示 ， 
如 图 8-13 所 示 。 


Learning Python 


localhost 


登录 页 面 


用 用 户 名 为 : qiwsir 登 录 


UserName: 


Password: 


图 8-13 ”首页 提示 


中 篆 尖 所 指 束 是 从 数据 库 中 读 取 出 来 的 用 户 名 ， 借 助 于 模板 中 的 双 
大 括号 “{{}}” 显 示 出 来 。 


{位 六 本质 上 是 占 位 符 ， 当 这 个 html 被 执行 的 上 时候， 这 个 位 置 会 被 一 
个 具体 的 对 象 【例如 上 面 就 是 字符 串 qiwsir) 所 替代 。 有 具体 是 哪个 具体 
对 象 替代 这 个 占 位 符 ， 完 全 由 render(0) 方 法 中 的 关键 词 来 指定 ， 也 就 是 
render0 中 的 关键 词 与 模板 中 的 占 位 符 包 右 痢 的 关键 词 一致 。 


用 这 种 方式 ， 修 改 一 下 用 户 正 确 登录 之 后 的 效果 。 要 求 用 户 正 确 登 录 
之 局 ， 跳 转 到 男 外 一 个 页 面 ， 并 且 在 那个 页 面 中 显示 出 用 户 的 完整 信 


先 修改 url.py 文 件 ， 在 其 中 增加 一 些 内 容 。 完 整 代码 如 下 : 


#!/usr/bin/env python 


# coding=utf-8 
the url Structure of website 


Import sys 
reload(sys) 


sys.setdefaultencoding("utf-8") 


from handlers.index import IndexHandler 


from handlers.user import UserHandler 


url=[ 
(r'/', IndexHandler), 


(r'/user', UserHandler), 


然后 就 建立 handlers/user.py 文 件 ， 内 容 如 下 : 


#!/usr/bin/env python 


# coding=utf-8 


import tornado.web 


import methods.readdb as mrd 


class UserHandler(tornado.web.RequestHandler): 
def get(self): 
username = self.get_argument("user") 
user_infos = mrd.select_table(table="users",column="*",condition="username",value=username) 


self.render("user.html", users = user_infos) 


在 getO 〇 中 使 用 self.get_argument ("user") ， 目 的 是 要 通过 un 获取 参数 
user 的 值 。 因 此 ， 当 用 户 登 录 后 ， 得 到 正确 的 返回 值 ， 那 么 js 应 该 用 这 
样 的 方式 载 入 新 的 页 面 。 


注意 ， 上 述 的 userpy 代 人 码 为 了 简单 仅 突 出 本 将 要 说 明 的 ， 没 有 对 
user_infos 的 结果 进行 判断 ， 但 在 实际 的 编程 中 ， 需 要 进行 判断 或 者 使 
用 try...except ° 


$(document).ready(function(){ 
$("#1l0gin").click(function(){ 
var user = $("#username").val(); 
var pwd = $("#password").val(); 
var pd = {"username":user, "password":pwd}; 
$.ajax({ 


type:"post", 


i 
data:pd, 
cache:false, 
Success:function(data){ 
window.1location.href = "/user?user="+data; 
}, 
error:function(){ 


alert("error!"); 


}); 
}); 
}); 


接 下 来 是 user.html 模 板 。 注 意 ， 上 面 的 代码 中 ，user_infos3| 用 的 对 象 
不 是 一 个 字符 串 了 ， 即 传 入 模板 的 不 是 一 个 字符 串 ， 而 是 一 个 元 组 。 
对 此 ， 模 板 这 样 来 处 理 它 : 


<!DOCTYPE html> 
<head> 
<meta charset="UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1" /> 
<title>Learning Python</title> 
</head> 
<body> 
<h2>Your informations are:</h2> 
<ul> 
{% for one in users %} 
<li>username:{{one[1]}}</1i> 
<1li>password:{{one[2]}}</1i> 
<li>email:{{one[3]}}</1i> 
{% end %} 
</ul> 


</body> 


显示 的 效果 如 图 8-14 所 示 。 
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© @ localhost 


Your informations are: 


es Username:qiwsir 
。 password:123123 
se。 email:qiwsir@gmail.com 


在 上 面 的 模板 中 ， 其 实用 到 了 模板 语法 。 
在 模板 的 双 大 括号 中 ， 可 以 写 类 似 Python 的 语句 或 者 表达 式 。 比 如 : 


>>> from tornado.template import Template 


>>> print Template("{{ 3+4 }}").generate() 

>>> print Template("{{ 'python'[0:2] }}").generate() 

py 

>>> print Template("{{ '-'.join(str(i) for i in range(10)) }}").generate() 


0-1-2-3-4-5-6-7-8-9 


如 果 在 模板 中 的 某 个 地 方 写 上 {{3+4}}， 当 那个 模板 被 render() 读 入 之 
后 ， 在 页 面 上 该 占 位 符 的 地 方 就 显示 7。 这 说 明 Tomado 自 动 将 双 大 括 
号 内 的 表达 式 进 行 计算 ， 并 将 其 结果 以 字符 串 的 形式 返回 到 浏览 器 输 


除了 表达 式 之 外 ，Python 的 语句 也 可 以 在 表达 式 中 使 用 ， 包 括 if、 
for、while 和 try。 只 不 过 要 有 一 个 语句 做 开始 和 结束 的 标记 ， 用 以 区 分 
哪里 是 语句 、 哪 里 是 HTML 标记 符 。 


语句 的 形式 ，{{% 语 句 %}} 
例如 : 


{{% if user=='qiwsir' %}} 
{{ user }} 
{{% end %}} 


上 面 的 举例 中 ， 第 一 行 虽然 是 if 语 句 ， 但 是 不 要 在 后 面 写 冒 号 了 。 最 
后 一 行 一 定 不 能 缺少 ， 表 示 语 句 块 结束 。 将 这 一 个 语句 块 放 到 模板 
中 ， 当 被 render 读 取 此 模板 的 时 候 ，Tornado 将 执行 结果 返回 给 浏览 器 
显示 ， 跟 前 面 的 表达 式 一 样 。 实 际 例子 中 可 以 看 上 图 的 输出 结果 和 对 
应 的 循环 语句 。 


8.3.8 转 义 字符 


虽然 读者 已 经 对 字符 转 义 问题 不 陌生 了 ， 但 是 在 网 站 开发 中 ， 它 还 是 
一 个 令 人 感到 麻烦 的 问题 。 转 义 字 符 (Escape Sequence) 也 称 为 字符 
实体 (Character Entity) ， 它 的 存在 是 因为 在 网 页 中 “<”、“>” 之 类 的 符 
号 不 能 直接 被 输出 ， 因 为 它们 已 经 被 用 作 了 HTML 标 记 符 ， 如 果 在 网 
页 上 用 到 它们 ， 惑 要 转 义 。 另 外 ， 还 有 一 些 字 符 在 ASCII 字 符 集 中 没 
pp 
有 定义 (如 版 权 符号 “=* ”) ， 若 这 样 的 符号 在 HTML 中 出 现 ， 也 需 
Fs 


要 转 义 字符 (如 “*=* ”对 应 的 转 义 字符 是 “&copy;”) 。 


上 述 古 指 前 端 页 面 的 字符 转 义 ， 在 后 问 程 序 中 ， 因 为 要 读 写 数 据 库 ， 
也 会 遇 到 字符 转 义 问题 。 


比如 一 个 人 简单 的 查询 语句 “select username，password from usertable 
where username='qiwsir”， 如 果 在 登录 框 中 没有 输入 “qiwsir”， 而 是 输 
入 了 “a;drop database;j”， 这 个 查询 语句 就 变 成 了 “select username， 
password from usertable where username=a;drop database;”， 如 果 后 端 程 
序 执行 了 这 条 语句 会 怎么 样 呢 ? 后 果 很 严重 ， 因 为 会 drop database， 届 
时 真 的 是 欲 器 无 词 了 。 类 似 的 情况 还 很 多 ， 比 如 还 可 以 输入 “<input 
type="text"/>”， 结 果 出 现 了 一 个 输入 框 ， 如 有 果 是 “<form action="..."”， 
束 会 造成 跨 站 攻击 。 这 方面 的 问题 还 很 多 ， 读 者 有 空 可 以 到 网 上 搜索 


所 以 ， 后 端 也 要 转 义 。 转 义 旦 不 是 很 及 烦 呢 ? 


Tornado 为 你 着 想 了 ， 因 为 存在 以 上 转 义 问题 ， 而 且 会 有 粗心 的 程序 员 
护 记 ， 于 是 在 Tomado 中 ， 模 板 默 认为 目 动 转 义 ， 这 是 多 么 好 的 设计 
呀 。 于 十 所 有 表单 输入 ， 你 殊 不 用 担心 会 遇 到 上 述 问 题 了 。 


为 了 能 够 体会 目 动 转 义 ， 不 妨 在 登录 框 中 输入 上 面 那样 的 字符 ， 然 后 
用 print 语 句 看 看 后 台 得 到 了 什么 〈 请 读者 自行 完成 ) 。 


目 动 转 义 是 一 个 好 事情 ， 但 是 ， 有 时 候 不 需要 转 义 ， 比 如 想 在 模板 中 
这 样 做 : 


<!DOCTYPE html> 


<head> 
<meta charset="UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1" /> 
<title>Learning Python</title> 
</head> 
<body> 
<h2> 登 录 页 面 </h2> 
<p> 用 用 户 名 为 ，{ {user}} 登 录 </p> 
<form method="POST"> 
<p><span>UserName:</span><input type="text" id="username"/></p> 
<p><span>Password:</span><input type="password" id="password" /></p> 
<p><input type="BUTTON" value=" 登 录 " id="login" /></p> 
</form> 
{% set website = "<a href='http://www.itdiffer.com'>welcome to my website</a>" %} 
{{ website }} 
<script src="{{static url("js/jquery.min.js")}}"></script> 
<script src="{{static url("js/script.js")}}"></script> 


</body> 


这 是 index.html 的 代码 ， 我 增加 了 {9%set website="<a 
href='http://www.itdiffer.com'>welcome to my website</a>"9%}， 作 用 是 
设置 一 个 变量 ， 名 字 是 website， 它 对 应 的 内 容 是 一 个 做 了 超 链 接 的 文 
字 。 然 后 在 下 面 使 用 这 个 变量 {{fwebsite}}， 本 和 希望 能 够 出 现 的 是 一 行 
字 “welcome to my website”， 单 击 这 行 字 ， 束 可 以 打开 对 应 链接 的 网 
站 。 可 是 ， 看 到 了 如 图 8-15 所 示 的 页 面 。 
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€ localhost 


登录 页 面 
站 用 用 户 名 为 : qiwsir 登 录 
UserName: 
Password: 
登录 


<a href='"http://www.itdiffer.com’>welcome to my website</a> 


二 
相 


会- 


图 8-15 ”自动 转 义 的 结果 


下 面 那 一 行 把 整个 源码 都 显示 出 来 了 ， 这 如 是 目 动 转 义 的 结 有 末 。 这 里 
需要 的 十 不 转 义 。 于 是 可 以 将 {{website}} 修 改 为 : 


{% raw website %} 


表示 这 一 行 不 转 义 。 但 是 别 的 地 方 还 是 转 义 的 。 这 是 一 种 最 推荐 的 方 


法 
如 有 果 你 要 全 转 义 ， 可 以 使 用 : 


{% autoescape None %} 


{{ website }} 


貌似 省 事 ， 但 是 并 不 推荐 使 用 。 


将 下 面 几 个 函数 放 在 这 里 备查 ， 或 许 在 某 些 时 候 会 用 到 ， 都 征 可 以 使 
用 在 模板 中 的 。 


。 escape (s) : 替换 字符 串 s 中 的 &、<、> 为 他 们 对 应 的 HTML 字 
符 。 

。 url_escape (s) : 使 用 urllib.quote_plus 替 换 字 符 串 s 中 的 字符 为 url 
编码 形式 。 


。 json_encode (val) : 将 val 编 码 成 JSON 格 式 。 

。 (s) : 过 滤 字 符 串 s， 把 连续 的 多 个 空白 字符 替换 成 一 个 
8.3.9 ”模板 继承 
用 前 面 的 方法 已 经 能 够 很 顺利 地 编写 模板 了 “。 如 果 读 者 留心 一 下 ， 会 
觉得 每 个 模板 都 有 相同 的 内 容 ， 遇 到 这 种 问题 ， 作 为 程序 员 应 该 想 
到 “继承 >?”， 它 的 作用 之 一 就 是 能 够 让 代码 重用 。 
在 Tornado 的 模板 中 ， 也 能 继承 。 


先 建立 一 个 文件 ， 命 名 为 base.html， 代 码 如 下 : 


<!DOCTYPE html> 


<html> 
<head> 
<meta charset="UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1" /> 
<title>Learning Python</title> 
</head> 
<body> 
<header> 
{% block header %}{% end %} 
</header> 
<content> 
{% block body %}{% end %} 
</content> 
<footer> 
{% set website = "<a href='http://www.itdiffer.com'>welcome to my website</a>" %} 
{% raw website %} 
</footer> 
<script src="{{static url("js/jquery.min.js")}}"></script> 
<script src="{{static url("js/script.js")}}"></script> 
</body> 


</html> 


接 下 来 就 以 base.html 为 父 模 板 ， 依 次 改写 index.html 模 板 和 user.html 模 
板 。 


index.html 代 码 如 下 : 


{% extends "base.html" %} 


{% block header %} 
<h2> 登 录 页 面 </h2> 
<p> 用 用 户 名 为 ，{ {user}} 登 录 </p> 
{% end %} 
{% block body %} 
<form method="POST"> 
<p><span>UserName:</span><input type="text" id="username"/></p> 
<p><span>Password:</span><input type="password" id="password" /></p> 
<p><input type="BUTTON" value=" 登 录 " id="login" /></p> 
</form> 


{% end %} 


user.html 的 代码 如 下 : 


{% extends "base.html" %} 


{% block header %} 
<h2>Your informations are:</h2> 


{% end %} 


{% block body %} 
<ul> 
{% for one in users %} 
<li>username:{{one[1]}}</1i> 
<1li>password:{{one[2]}}</1i> 
<li>email:{{one[3]}}</1i> 
{% end %} 
</ul> 


{% end %} 


以 上 代码 已 经 没有 以 前 重复 的 部 分 了。“{%extends"base.html"%}”* 意 味 
着 以 base.html 为 父 模板 。 在 base. i 同 “{%block 
header%}{%end%}” 这 样 的 块 语句 ， 在 index. html 和 user html 中 ， 分 别 对 
块 语句 中 的 内 容 进 行 了 重 写 (或 者 说 是 填充 ) 。 这 就 相当 于 在 
base.html 中 做 了 一 个 结构 ， 在 子 模板 中 按照 这 个 结构 填 内 容 。 


8.3.10 GSS 
基本 的 流程 已 经 莽 不 多 了 ， 如 果 要 美化 前 端 ， 还 需要 使 用 css， 它 的 使 


用 方法 跟 js 类 似 ， 也 是 在 静态 日 录 中 建立 文件 即 可 。 然 后 把 下 面 这 句 
加 入 到 base.html 的 <head></head> 中 : 


<link rel="stylesheet" type="text/css" href="{{static url("css/style.css")}}"> 


当然 ， 要 在 style.css 中 写 一 个 样式 ， 比 如 : 


body { 
color:red; 


} 


然后 看 看 前 端 显 示 什 么 样子 了 ， 如 图 8-16 所 示 。 
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登录 页 面 


用 用 户 名 为 ;: qiwsir 登 录 


UserName: 


Password: 


Welcome to mv website 


图 8-16 前端 显示 


0 就 不 重点 讲解 了 ， 读 者 可 以 参考 关于 
CSS 的 资料 。 


至 此 ， 一 个 简单 的 基于 Tomado 的 网 站 就 做 好 了 ， 昌 然 它 很 壬 ,但 古 它 
很 有 前 途 。 因 为 读者 只 要 按照 上 述 的 讨论 ， 束 可 以 在 里 面 增加 各 种 目 
己 认为 可 以 增加 的 内 容 。 


建议 读者 在 学 习 以 上 内 容 基 础 上 ， 可 以 继续 完成 下 面 的 几 个 功能 : 


。 用 户 注 册 。 

。 用 户 发 表 文 章 。 

。 用 户 文章 列表 ， 并 根据 文章 标题 查看 文章 内 容 。 
。 用 户 重 新 编辑 文章 。 


8.3.11 ”cookie 和 安全 


cookie 是 现在 网 站 重要 的 内 容 ， 特 别 是 当 有 用 户 登 录 的 上 时候， 所 以 需 
要 学 习 了 解 cookie。 维 基 百 科 如 是 说 : 


cookie (复数 形态 cookies) ， 中 文 名 称 为 小 型 文本 文件 或 小 甜 饼 ， 指 
某 些 网 站 为 了 辨别 用 户 身份 而 储存 在 用 户 本 地 终端 (Client Side) 上 的 
数据 (通常 经 过 加 密 ) 。 定 义 于 RFC2109。 是 网 景 公 司 的 前 雇员 Lou 
Montulli 在 1993 年 3 月 发 明 的 。 


天 于 cookie 的 作用 ， 维 基 百 科 说 得 非常 详细 : 


因为 HTTP 协 议和 是 无 状态 的 ， 即 服务 套 不 知道 用 户 上 一 次 做 了 什么 ， 这 
严重 阻碍 了 交互 式 Web 应 用 程序 的 实现 。 在 典型 的 网 上 购物 场景 中 ， 

用 户 浏 览 了 几 个 页 面 ， 闫 了 一 盒 饼干 和 两 瓶 钦 料 。 最 后 结账 时 ， 由 于 
HTTP 的 无 状态 性 ， 不 通过 额外 的 手段 ， 服 务 硕 并 不 知道 用 户 到 帮 严 了 
什么 。 所 以 cookie 就 是 用 来 绕 开 HITP 的 无 状态 性 的 “额外 手段 ”之 一 。 
服务 硕 可 以 设置 或 读 取 cookies 中 包含 的 信息 ， 借 此 维护 用 户 跟 服 务 需 
会 话 中 的 状态 。 


在 刚才 的 购物 场景 中 ， 当 用 户 选 购 了 第 一 项 商品 ， 服 务 絮 在 癌 用 户 发 
送 网 页 的 同时 ， 还 发 送 了 一 段 cookie， 记 了 杂 着 那 项 商品 的 信息 。 当 用 
户 访 问 男 一 个 页 面 ， 浏 览 器 会 把 cookie 发 送 给 服务 器 ， 于 是 服务 器 就 
知道 他 之 前 选 购 了 什么 。 用 户 继续 选 购 馅 料 ， 服 务 器 就 在 原来 那 段 
cookie 里 追加 新 的 商品 信息 。 结 账 时 ， 服 务 器 读 取 发 送 来 的 cookie 束 行 
了 了 o 


cookie 男 一 个 典型 的 应 用 是 ， 当 登录 一 个 网 站 时 网 站 往往 会 请 求 用 户 
输入 用 户 名 和 和 密码， 并 且 用 户 可 以 勾 选 “下 次 目 动 登 录 ”。 如 果 人 勾 选 
了 ， 那 么 下 次 访问 同一 网 站 时 ， 用 户 会 发 现 没 输 入 用 户 名 和 密码 就 已 
经 营 隶 了。 这 下 是 因为 前 一 次 登录 时 ， 服 务 右 发 送 了 包含 登录 凭据 
(用 户 名 加 密码 的 某 种 加 密 形式 ) 的 cookie 到 用 户 的 硬 弄 上 。 第 二 次 


登录 时 (如 采 该 cookie 尚 未 到 期 ) 浏览 器 会 发 送 该 cookie 服 务 器 验证 和 赁 
据 ， 于 是 不 必 输 入 用 户 名 和 密码 就 让 用 户 登 录 了 。 


cookie 也 有 缺陷 ， 比 如 来 目 伟 大 的 维基 百科 也 列 出 了 三 条 : 


。 cookie 会 被 附加 在 每 个 HTTP 请 求 中 ， 所 以 无 形 中 增加 了 流量 。 

。 由 于 在 HTTP 请 求 中 的 cookie 是 明文 传递 的 ， 所 以 安全 性 成 问题 
(除非 用 HTTPS) 。 

。 cookie 的 大 小 限制 在 4KB 左 右 ， 或 许 在 某 些 情况 下 有 点 不 够 用 。 


对 于 用 户 来 说 ， 可 以 通过 改变 浏览 套 的 设置 来 禁用 cookie， 也 可 以 删 
除 历史 的 cookie。 但 就 目前 而 言 ， 大 多 数 人 痢 不 再 禁用 cookie 了。 


cookie 最 让 人 担心 的 还 是 由 于 它 存储 了 用 户 的 个 人 信息 ， 并 且 最 终 这 
些 信 息 要 发 给 服务 器 ， 那 么 它 就 会 成 为 某 些 人 的 目标 或 者 工具 ， 比 如 
有 cookie 盗 贼 ， 融 是 搜集 用 户 cookie， 然 后 利用 这 些 信 息 进 入 用 户 账 
号 ， 达 到 个 人 某 种 不 可 告 人 之 目的 ;还 有 被 称 之 为 cookie 投 毒 的 说 
法 ， 是 利用 客户 端的 cookie 传 给 服务 器 的 机 会 ， 修 改 传 回去 的 值 。 这 
些 行为 常常 是 通过 一 种 被 称 为 “ 跨 站 指令 脚本 (Cross site 

scripting) ”( 或 者 跨 站 指令 码 ) 的 行为 方式 实现 的 。 伟 大 的 维基 百科 
这 样 解释 了 跨 站 脚本 : 


跨 网 站 脚本 (Cross-site scripting， 通 常人 简称 为 XSS 或 跨 站 脚本 或 跨 站 
脚本 攻击 ) 是 一 种 网 站 应 用 程序 的 安全 漏洞 攻击 ， 是 代码 注入 的 一 
种 。 它 允许 恶意 用 户 将 代码 注入 到 网 页 上 ， 其 他 用 户 在 观看 网 页 时 束 
会 受到 影响 。 这 类 攻击 通常 包含 HTML 和 用 户 端 脚本 语言 。 


XSS 攻 击 通常 指 的 是 利用 网 页 开发 时 留 下 的 漏洞 ， 通 过 巧妙 的 方法 注 
入 恶意 指令 代码 到 网 页 ， 使 用 户 加 载 并 执行 攻击 者 恶意 制造 的 网 页 程 
序 。 这 些 恶 意 网 页 程序 通常 是 JavaScript， 但 实际 上 也 可 以 包括 Java、 

VBScript、ActiveX、Flash 或 者 是 普通 的 HTML。 攻 击 成 功 后， 攻击 者 
可 能 得 到 更 高 的 权限 (如 执行 一 些 操 作 ) 、 私 密 网 页 内 容 、 会 话 和 


cookie 等 各 种 内 容 。 


对 cookie 的 音 遇 侯 用 ， 用 户 和 网 站 都 受益 了 ， 但 也 要 防止 有 人 用 它 作 


在 Tomado 中 ， 也 提供 对 cookie 的 读 写 函数 ， 帮 助 我 们 管理 和 使 用 它 。 


get_cookie() 是 默认 提供 的 两 个 方法 ， 但 它 是 明文 不 加 密 
前 日 。 


在 index.py 文 件 的 IndexHandler 类 的 postO) 方 法 中 ， 当 用 户 登 录 ， 验 证 用 
户 名 和 和 密码 后 ， 将 用 户 名 和 密码 存 入 cookie， 代 码 如 下 : 


def post(self): 


username = self.get_argument("username") 
password = self.get_argument("password") 
user_infos = mrd.select_table(table="users", column="*", condition="username", value=username) 
if user_infos: 
db_pwd = user_infos[9][2] 
if db_pwd == password: 
self.set_cookie(username, db_pwd) # 设 置 cookie 
self.write(username) 
else: 
self.write("your password was not right.") 
else: 


self.write("There is no thi user.") 


上 面 代 码 中 ， 较 以 前 只 增加 了 一 句 “self.set_cookie (username, 
db_pwd) ”， 再 回 到 登录 页 面 ， 运 行 之 后 如 图 8-17 所 示 。 


看 图 8-17 中 篆 头 所 指 ， 从 左 开始 的 第 一 个 是 用 户 名 ， 第 二 个 十 存储 的 
尸 密码 。 将 我 在 登录 时 输入 的 密码 以 明文 的 方式 存储 在 cookie 里 


明文 存储 ， 显 然 不 安全 。 


Tornado 提 供 男 外 一 种 安全 的 方法 : set_secure_cookie() 和 
get_secure_cookie()， 之 所 以 称 其 为 安全 cookie， 是 因为 它 以 明文 加 密 
的 方式 传输 。 此 外 ， 跟 set_cookie0 的 区 别 还 在 于 ，set_secure_cookie0) 
执行 后 的 cookie 保 存在 磁盘 中 ， 直 到 它 过 期 为 止 。 也 是 因为 这 个 原 

， 即 使 关闭 浏 顺 右 ， 在 失 致 时 间 以 前 ，cookie 都 一 直 存 在 。 


Learning Python 


所 @ localhost 


Your informations are: 


es USername:gqiwsir 
es。 password:123123 
。 email:qiwsir@gmail.com 


welcome to mv website 


可 WW《 》 运 console HTML C55 Script DOM Net | Cookiesv 


# Cookies ”Filter ” Default (Accept cookies) > 


Name 二 | Value | Domain 
4 qiwsir 12312 localhost 


AN 


图 8-17” 回 到 登录 页 面 


要 是 用 set_secure_cookie() 方 法 设置 cookie， 要 人 先 在 application.py 文 件 的 
setting 中 进行 如 下 配置 : 


setting = dict( 


template_path = os.path.join(os.path.dirname(_ file ), "templates"), 
static path = os.path.join(os.path.dirname(_ file ), "statics"), 
cookie_ secret = "bzJc2swbQLKos6GkHn/VB9oXwQt8SOROkRVvJ5/xJ89E="， 


) 


其 

中 “cookie_secret="bZJc2sWbQLKos6GkHn/VB9oXwQt8SOROkRVvJ5/xJ8 
9E="” 是 为 此 增加 的 ， 但 是 ， 它 并 不 是 真正 的 加 密 ， 仪 仪 是 一 个 障 眼 法 
于 了 。 

因为 tornado 会 将 cookie 值 编码 为 Base-64 字 符 串 ， 


一 人 cookie 门 容 的 HMAC 生 名 。 所 以 ，cookie_secret 的 值 ， 常用 下 面 
的 方式 生成 〈 这 是 一 个 随机 的 字符 串 ) : 


>>> import base64, uuid 


>>> base64.b64encode(uuid.uuid4().bytes) 


"w8yZud+kRHiP9uUABEXaQiA== 


如 果 嫌 弃 上 面 的 签名 短 ， 可 以 用 “base64.b64encode 
(uuid.uuid4().bytes+uuid.uuid4().bytes) ”获取 。 这 里 得 到 的 是 一 个 随 
机 字符 串 ， 用 它 作 为 cookie_secret 值 。 
然后 修改 index.py 中 设置 cookie 那 句 话 ， 变 成 : 
self.set_secure_cookie(username, db_pwd) 
重新 跑 一 个 ， 歼 果 如 图 8-18 所 示 。 
啊 哈 ， 果 然 * 密 ”了 很 多 。 


如 果 要 获取 此 cookie， 用 self.get_secure_cookie (usemame) 即 可 。 


。 USername:qiwsir 
» password:123123 
。 email:qiwsir@gmail.com 


Welcome to my website 


ss YW > Console HTML C55 5 
Cookies » Filter ”Default (Accept cookies) * 


Name 二 Value 
3 qiwsir 


Value 


“211;:9116:143273671416:qliwsir18:MTIZHTIz|ecff9a4666197da3f2d9c4f72456a3c364f6ced73253d9bc42e4fe416a6 
ee326” 


图 8-18 ”修改 后 效果 图 


这 样 是 不 是 区 安全 了 9? 如 果 这 样 就 安全 了 ， 那 你 也 太 低 估 黑 客 们 的 技 
术 实 力 了 ， 甚 至 于 用 户 自己 也 会 修改 cookie 值 。 还 要 更 安全 ， 所 以 又 
有 了 httponly 和 secure 属 性 ， 用 来 防范 cookie 投 毒 。 设 置 方 法 是 : 


self.set_secure_cookie(username, db_pwd, httponly=True, secure=True) 


要 获取 cookie， 可 以 使 用 self.set_secure cookie (username) 方法 ， 将 这 
句 放 在 user.py 中 某 个 适合 的 位 置 ， 并 且 可 以 用 print 语 句 打 印 出 结果 ， 


就 能 看 到 变量 username 对 应 的 cookie 了。 这 时 候 已 经 不 是 那个 “ 密 ” 过 
的 ， 是 明文 显示 。 


用 这 样 的 方法 ， 浏 览 亏 通 过 SSL 连 接 传递 cookie， 能 够 在 一 定 程度 上 防 
范 跨 站 脚本 攻击 。 


8.3.12 XSRF 


XSRF 的 含义 是 Cross-site request forgery， 即 跨 站 请 求 伪 造 ， 也 称 之 
为 “one click attack”， 通 常 缩写 成 CSRF 或 者 XSRF， 可 以 读 作 “sea 
surf”。 这 种 对 网 站 的 攻击 方式 跟 上 面 的 跨 站 脚本 (XSS) 似乎 相像 ， 
但 攻击 方式 不 一 样 。XSS 利 用 站 点 内 的 信任 用 户 ， 而 XSRF 则 通过 伪装 
来 自 受 信任 用 户 的 请 求 而 利用 受信 任 的 网 站 。 与 XSS 攻 击 相 比 ，XSRF 
攻击 往往 不 大 流行 《因此 对 其 进行 防范 的 资源 也 相当 稀少 ) 和 难以 防 
范 ， 所 以 被 认为 比 XSS 更 具 和 危险 性 。 


还 有 一 部 需要 提醒 读者 ， 即 在 开发 应 用 时 需要 深 谍 远虑。 任何 会 产生 
副作用 的 HTTP 请 求 ， 比 如 单 击 购买 按钮 、 编 辑 账户 设置 、 改 变 密 码 或 
删除 文档 等 都 应 该 使 用 post0 方 法 ， 这 有 是 恨 好 的 RESTfu 做 法 。 


又 一 个 新 名 词 : REST。 这 是 一 种 Web 服 务实 现 方案 。 伟 大 的 维基 百科 
中 这 样 描述 : 

表征 性 状态 传输 (英文 Representational State Transfer， 人 简称 REST) 
是 Roy Fielding 博 士 在 2000 年 他 的 博士 论文 中 提出 来 的 一 种 软件 架构 风 
格 。 目 前 在 三 种 主流 的 Web 服 务实 现 方案 中 ， 因 为 REST 模 式 与 复杂 的 
SOAP 和 XML-RPC 相 比 更 加 简洁 ， 越 来 越 多 的 web 服务 开始 采用 REST 
风格 设计 和 实现 。 例 如 ，Amazon.com 提 供 接 近 REST 风 格 的 Web 服 务 
进行 图 书 查找 ; 雅虎 提供 的 web 服务 也 是 REST 风 格 的 。 


在 Tornado 中 还 提供 了 XSRF 保 护 的 方法 。 
在 application.py 文 件 中 使 用 xsrf_cookies 参 数 开局 XSRF 保 护 。 


setting = dict( 


template_path = os.path.join(os.path.dirname(_ file ), "templates"), 
static _ path = os.path.join(os.path.dirname(_ file ), "statics"), 
cookie_ secret = "bzJc2swbQLKos6GkHn/VB9oXwQt8SOROkRVvJ5/xJ89E="， 


xsrf_cookies = True, 


这 样 设置 之 后 ，Tornado 将 拒绝 请 求 参数 中 不 包含 正确 的 _xsrf 值 的 
postput/delete 请 求 。Tornado 会 在 后 面 悄 悄 地 处 理 _xsrf cookies， 所 
以 ， 在 表单 中 也 要 包含 XSRF 令 牌 以 确保 请 求 合 法 。 比 如 index.html 的 
表单 ， 修 改 如 下 : 


{% extends "base.html" %} 


{% block header %} 
<h2> 登 录 页 面 </h2> 
<p> 用 用 户 名 为 ，{ {user}} 登 录 </p> 
{% end %} 
{% block body %} 
<form method="POST"> 
{% raw xsrf_form_ html() %} 
<p><span>UserName:</span><input type="text" id="username"/></p> 
<p><span>Password:</span><input type="password" id="password" /></p> 
<p><input type="BUTTON" value=" 登 录 " id="login" /></p> 
</form> 


{% end %} 


“{%raw xsrf_form_html0%}”* 是 新 增 的 ， 目 的 束 在 于 实现 上 面 所 说 的 授 
权 给 前 端 以 合法 请 求 。 


前 端 向 后 端 发 送 的 请 求 是 通过 Ajax0， 所 以 ， 在 Ajax 请 求 中 ， 需 要 一 


个 _xsrf 参 数 。 


以 下 是 script.js 的 代码 : 


function getCookie(name){ 


var x = document.cookie.match("\\b" + name + "=([^;]*)\\b"); 
return x ? x[1]:undefined; 


} 


$(document).ready(function(){ 
$("#10gin").click(function(){ 
var user = $("#username").val(); 
var pwd = $("#password").val(); 
var pd = {"username":user, "password":pwd, "_xsrf":getCookie(" xsrf")}; 
$.ajax({ 
type:"post", 
WW 
data:pd, 


cache:false, 


Success:function(data){ 

window.location.href = "/user?user="+data; 
}, 
error:function(){ 


alert( errort"ys 


函数 getCookie() 的 作用 是 得 到 cookie 值 ， 然 后 将 这 个 值 放 到 向 后 端 post 
的 数据 中 “var pd={"username":user,，"password":pwd，"_xsrf":getCookie 
("_xsrf") };”。 运行 的 结果 如 图 8-19 所 示 。 


es Username:qiwsir 
es。 password:123123 
es。 email:qiwsir@gmail.com 


welcome to my website 


"we = Console C55 Script DOM Net Cookies v 


Cookies » Filter > ault (Accept cookies) ~ 


xsf 
Value 
2|baB2cebc |99e47b3159699985d81f2bfa4e3915bd| 1432782971 


1 qiwsir 


图 8-19 ”运行 结果 


这 十 Tomado 提 供 的 XSRF 防 护 方法 。 是 不 古 这 样 做 束 高 枕 无 忧 了 呢 ? 
世界 是 复杂 的 ， 要 做 好 一 个 网 站 ， 需 要 考虑 的 事情 还 很 多 。 


名 着 听 到 人 说 做 个 网 站 怎么 简单 ， 客 户 用 这 种 说 娠 来 压低 价格 ， 老 板 

用 这 种 说 辞 来 缩短 工时 成 本 ， 从 上 面 的 简单 叙述 中 ， 你 还 觉得 网 站 是 

人 除非 那个 网 站 不 是 给 人 看 的 ， 而 是 在 那 
去 | oo 


8.3.13 用户 验证 


用 户 登 录 之 后 ， 当 翻 到 别 的 网 页 中 时 ， 往 往 需要 验证 用 户 是 否 处 于 登 
了 永 状 态 。 当 然 ， 一 种 比较 直接 的 方法 ， 束 是 在 转 到 每 个 目 孙 时 ， 都 从 
Cookie 中 把 用 户 信息 传 到 后 端 ， 跟 数据 库 验 证 。 这 不 仅 征 直接 的 ， 也 
征 基 本 的 流程 。 但 是 ， 如 条 这 个 过 程 总 让 用 户 目 己 来 做 ， 框 汇 的 作用 
束 显 不 出 来 了 。Tomado 束 提供 了 一 种 用 户 验 证 方法 。 

为 了 后 面 更 工程 化 地 使 用 Tomado 编 程 ， 需 要 将 前 面 已 经 有 的 代码 进行 
重新 梳理 。 下 面 只 征 将 有 修改 的 文件 代码 写 出 来 ， 不 做 过 多 解释 ， 必 
要 的 有 注释 ， 相 信 读 者 在 学 习 前 面 内 容 的 基础 上 能 够 理解 。 


在 handler 目 录 中 增加 一 个 文件 ， 名 称 是 base.py， 代 码 如 下 : 


#! /usr/bin/env python 


# coding=utf-8 
import tornado.web 


class BaseHandler(tornado.web.RequestHandler): 
def get_current_user(self): 


return self.get_ secure cookie("user") 


在 这 个 文件 中 ， 目 前 只 做 一 件 事 情 ， 就 是 建立 一 个 名 为 BaseHandler 的 
类 ， 然 后 在 里 面 放 置 一 个 方法 ， 就 是 得 到 当前 的 Cookie。 在 这 里 要 特 
别 向 读者 说 明 ， 在 这 个 类 中 ， 其 实 还 可 以 写 很 多 别 的 东西 ， 比 如 你 可 
以 将 数据 库 连 接 写 到 这 个 类 的 初始 化 _init_0 方 法 中 。 因 为 在 其 他 的 
类 中 ， 我 们 要 继承 这 个 类 。 所 以 ， 这 样 一 个 织 势 就 为 读者 以 后 的 扩展 
增加 了 元 余 空 间 。 


然后 把 index.py 文 件 改 写 为 : 


#!/usr/bin/env python 


# coding=utf-8 


import tornado .escape 


import methods .readdb as mrd 


from base import BaseHandler 


class IndexHandler(BaseHandler ) : # 继 承 base .py 中 的 类 BaseHandler 
def get(self): 
usernames = mrd.select_columns(table="users",column="username") 
one_user = usernames[0][9] 


self.render("index.html", user=one_user) 


de 


a 


post(self): 
username = self.get_argument("username") 
password = self.get_argument("password") 
user_infos = mrd.select_table(table="users", column="*", condition="username", value=username) 
if user_infos: 
db_pwd = user_infos[9][2] 
if db_pwd == password: 
self.set_current_user (username) # 将 当前 用 户 名 写 入 cookie 
Self.write(username ) 
SLS 
self.write("-1") 
Slee 


self.write("-1") 


def set_current_user(self, user): 
if user: 
# 注 意 这 里 使 用 了 tornado.escape.json_encode() 方 法 
self.set_secure_cookie('user', tornado.escape.json_encode(user)) 
else: 


self.clear_cookie("user") 


class ErrorHandler (BaseHandler): # 增 加 了 一 个 专门 用 来 显示 错误 的 页 面 
def get(self): 


self.render("error.html") 


在 index.py 的 类 IndexHandler 中 ， 继 承 了 BaseHandler 类 ， 并 且 增 加 了 一 
个 方法 ，set_current_user() 用 于 将 用 户 名 写 入 Cookie。 请 读者 特别 注意 
tornado.escape.json_encode() 方 法 ， 其 功能 是 : 


tornado.escape.json_encode(value) JSON-encodes the given Python object. 


如 果 要 查看 源码 ， 可 以 阅读 : 


http:/www.tornadoweb.org/en/branch2.3/escape.html 。 


这 样 做 的 本 质 是 把 user 转 化 为 json， 写 入 到 了 Cookie 中 。 如 果 从 Cookie 
中 把 它 读 出 来 ， 使 用 user 的 值 时 ， 还 会 用 到 : 


tornado ,escape.json_decode(value) Returns Python objects for the given JSON string 


它们 与 json 模 块 中 的 dumpO0、1load0 功 能 相仿 。 
接 下 来 要 对 userpy 文 件 也 进行 重 写 : 


#!/usr/bin/env python 


# coding=utf-8 


import tornado.web 
import tornado.escape 
import methods.readdb as mrd 


from base import BaseHandler 


class UserHandler (BaseHandler): 
@tornado.web.authenticated 
def get(self): 
#Uusername = self.get argument("user") 
username = tornado.escape.json_decode(self.current_user) 
user_infos = mrd.select_table(table="users", column="*", condition="username", value=username) 


self.render("user.html", users = user_infos) 


在 get0 方 法 前 面 添 加 @tormnado.web.authenticated， 这 是 一 个 装饰 器 ， 它 
的 作用 就 是 完成 Tomado 的 认证 功能 ， 即 能 够 得 到 当前 合法 用 户 。 在 原 
来 的 代码 中 ， 用 username=self.get_argument ("user") 方法 ， 从 url 中 得 
到 当前 用 户 名 ， 现 在 把 它 注释 挥 ， 改 用 self.current_user， 这 是 和 前 面 
的 装饰 器 配合 使 用 的 ， 如 果 它 的 值 为 假 ， 束 根据 setting 中 的 设置 ， 寻 
找 login_url 所 指定 的 目录 (请 关注 下 面 对 setting 的 配置 ) 。 


由 于 在 index.py 文 件 的 set_current_user() 方 法 中 ， 是 将 user 值 转化 为 json 
写 入 Cookie 的 ， 这 里 就 得 用 username=tornado.escape.json_decode 

(self.current_user) 解码 。 得 到 的 username 值 ， 可 以 被 用 于 后 一 句 中 的 
数据 库 查 询 。 


application.py 中 的 setting 也 要 做 相应 修改 : 


#!/usr/bin/env python 


# coding=utf-8 


from url import url 


import tornado.web 


import os 


setting = dict( 
template_path = os.path.join(os.path.dirname(_ file ), "templates"), 
static path = os.path.join(os.path.dirname(_ file ), "statics"), 


cookie_secret = "bzZJc2sWbQLKos6GkHN/VB90XwQt8SOROKkRVJS5/xJ89E=", 


与 以 前 代码 的 重要 区 别 在 于 “login_url=W，”， 如 果 用 户 不 合法 ， 根 据 
这 个 设置 ， 会 返回 到 首页 。 当 然 ， 如 果 有 单独 的 登录 界面 ， 比 
如 /login， 也 可 以 login_url=vlogin'。 


如 此 完成 的 是 用 户 登 录 到 网 站 之 后 ， 在 页 面 转 换 的 时 候 实现 用 户 认 


证 。 
8.3.14 相关 概念 
1. 同 步 和 异步 


有 不 少 资料 对 这 两 个 概念 做 了 不 同 角度 和 层面 的 解释 。 在 我 来 看 ， 最 
典型 的 例子 就 是 打 电 话 和 发 短信 。 


打 电 话 就 是 同步 。 张 三 给 李 四 打 电话 ， 张 三 说 : “是 李 四 吗 ? ”。 当 这 
个 信息 被 张 三 发 出 ， 提 交 给 李 四 ， 等 竺 李 四 的 响应 (一 般 会 听 

到 “是 ”， 或 者 “不 是 ”) ， 只 有 得 到 了 李 四 返 回 的 信息 之 后 ， 才 能 进行 
后 续 的 信息 传送 。 


发 短信 是 异步 。 张 三 给 李 四 发 短信 ， 编 辑 了 一 句 话 “ 今 晚 一 起 看 老 齐 的 
《 零 基础 学 python》”， 发 送 给 李 四 。 李 四 或 许 马 上 回复 ， 或 许 过 一 自 
时 间 才 回复 ， 这 段 时 间 有 多 长 不 一 定 。 总 之 ， 李 四 不 管 什么 时 候 回 
复 ， 张 三 会 以 听 到 短信 铃声 为 提示 查看 短信 。 


以 上 方式 理解 “同步 "和 “异步 ”不 古 很 精准 ， 有 些 地 方 或 许 有 率 强 。 要 
严格 理解 ， 需 要 用 严格 一 点 的 定义 表述 〈 以 下 表述 参照 了 “ 知 乎 "上 的 


回答 ) : 


同步 和 异步 关注 的 是 消息 通信 机 制 (synchronous 
communication/asynchronous communication ) 


所 谓 同步 ， 束 是 在 发 出 一 个 “调用 ”时 ， 在 没有 得 到 结果 之 前 ， 该 < 调 
用 ” 束 不 返回 。 但 是 一 旦 调用 返回 ， 殊 得 到 返回 值 了 。 换 句 话 说 ， 束 是 
由 “调用 者 ”主动 等 待 这 个 “调用 ”的 结 采 。 


而 异步 则 相反 , “调用 ”在 发 出 之 后 ， 区 ® 直 接 返 回 了 ， 所 以 没有 返回 结 
果 。 换 句 话说 ， 当 一 个 异步 过 程 调 用 发 出 后 ， 调 用 者 不 会 并 刻 得 到 结 
果 。 而 是 在 “调用 ”发 出 后 ,“ 被 调用 者 ”通过 状态 、 通 知 来 通知 调用 
者 ， 或 通过 回调 函数 处 理 这 个 调用 。 

可 能 还 是 前 面 的 打 电 话 和 发 短信 更 好 理解 。 

2. 阻 塞 和 非 阻塞 

“阻塞 和 非 阻塞 "与 “同步 和 有 异步 ”种 党 被 混为一谈 ， 其 实 它 们 之 间 还 坪 
有 老 别 的 。 如 和 泉 按 照 一 个 “ 产 不 多 ”先生 的 思维 方法 ， 你 也 可 以 不 那么 
深究 它们 之 间 学 理 上 的 有 差距， 反正 在 你 的 程序 中 ， 会 使 用 束 可 以 了 。 
不 过 ， 必 要 的 严 谍 还 十 需 要 的 ， 特 别 是 本 书 中 ， 要 装扮 的 让 别人 看 来 
目 己 届 ， 于 古 殊 再 引用 知 乎 上 的 说 明 : 


蛆 瑟 和 非 阳 丢 关注 册 苹 程 厅 在 守 得 调用 结 玉 (消息 、 返 回 值 ) 时 的 状 


阻塞 调用 坪 指 调用 结 打 返回 之 前 ， 当 前 线程 会 被 挂 起 ， 调 用 线程 只 
在 得 到 结果 之 后 才 会 返回 。 非 阻塞 调用 是 指 在 不 能 立刻 得 到 结果 之 
前 ， 该 调用 不 会 阻塞 当前 线程 。 

按照 这 个 说 明 ， 发 短信 显然 攀 是 非 阻 赛 ， 发 出 去 一 条 短信 之 后 ， 你 利 
用 手机 还 可 以 干 别 的 ， 乃 至 于 再 发 一 条 "“ 老 齐 的 谋 程 没意思 ， 还 征 看 
PHP 刺 激 ? 也 是 可 以 的 。 


不 是 本 教程 的 重点 ， 读 者 可 以 参阅 这 篇 
时: 


http://www.cppblog.com/converse/archive/2009/05/13/82879.html， 文 章 
作者 做 了 细致 入 微 的 辨析 。 


8.3.15 ”Tornado 的 同步 


此 前 ， 在 Tormado 基 础 上 已 经 完成 的 Web 就 是 同步 的 、 阻 塞 的 。 为 了 更 
明显 地 感受 这 一 点 ， 不 妨 这 样 试 一 试 。 


在 handlers 文 件 夹 中 建立 一 个 文件 ， 命 名 为 sleep.py。 


#!/usr/bin/env python 


# coding=utf-8 
from base import BaseHandler 
Import time 
class SleepHandler(BaseHandler ) : 
def get(self) : 
time.sleep(17) 
self.render("sleep.html") 
class SeeHandler(BaseHandler): 


def get(self): 


self.render("see.html") 


sleep.html 和 see.html 是 两 个 简单 的 模板 ， 内 容 可 以 自己 写 。 别 坊 记 修改 
url.py 中 的 目 隶 。 


然后 测试 稍微 复杂 一 点 ， 打 开 浏 贤 器 之 后 ， 打 开 两 个 标签 ， 分别 在 两 
个 标签 中 输入 localhost 8000/sleep ( 记 为 标签 1) 和 ]localhost:8000/see 


( 记 为 标签 2) ， 注 意 我 用 的 是 8000 端 口 。 输 入 之 后 先 不 要 单 击 回 车 访 
问 。 做 好 准备 ， 记 住 切换 标签 可 以 用 “ctrl-tab” 组 合 键 。 


1. 执 行 标签 1， 让 它 访 问 网 站 。 
2. 马 上 切换 到 标签 2， 访 问 网 址 。 
3. 注 意 观 察 ， 两 个 标签 页 面 ， 征 不 是 都 在 显示 “正在 访问 ， 请 等 待 ”。 


4. 当 标签 1 不 呈现 等 待 提示 (比如 一 个 正在 转 的 圆圈 ) 时 ， 标 签 2 的 表 
现 如 何 ? 几乎 同时 也 访问 成 功 了 。 


建议 读者 修改 sleep.py 中 的 time.sleep (17) 这 个 值 ， 多 试 试 。 


当然 ， 这 是 比较 笨拙 的 方法 ， 可 以 通过 测试 工具 完成 上 述 操作 比较 。 
8.3.16 ”异步 设置 


Tornado 本 来 就 是 一 个 异步 的 服务 框架 ， 体 现在 Tomado 的 服务 絮 和 客 

户 端 的 网 络 交 互 的 异步 上 ， 起 作用 的 是 tornado.ioloop.IOLoop。 但 是 如 
果 在 客户 端 请 求 服务 右 之 后 ， 在 执行 某 个 方法 的 时 候 ， 比 如 上 面 的 代 
码 中 执行 get0 方 法 的 有 时候， 遇 到 了 time.sleep (17) 这 个 需要 执行 时 间 
比较 长 的 操作 ， 耗 费时 间 ， 就 会 使 整个 Tornado 服 务 器 的 性 能 受 限 。 


为 了 解决 这 个 问题 ，Tormado 提 供 了 一 僚 异 步 机 制 ， 束 是 异步 疙 饰 如 
(@tornado.web.asynchronous ° 


#!/usr/bin/env python 


# coding=utf-8 


import tornado.web 


from base import BaseHandler 


import time 


class SleepHandler (BaseHandler): 
@tornado.web.asynchronous 
def get(self): 
tornado.ioloop.IOLoop.instance().add timeout(time.time() + 17, callback=self. on_response) 
def on_response(Self) : 
self.render("sleep.html") 


self.finish() 


将 sleep.py 的 代码 如 上 述 一 样 改造 ， 即 在 get() 方 法 前 面 增加 了 装饰 妖 
@tornado.web.asynchronous， 它 的 作用 在 于 将 Tornado 服 务 絮 本 里 默认 
的 设置 _auto_fininsh 值 修改 为 False。 如 果 不 用 这 个 装饰 器 ， 客 户 端 访 
问 服 务 絮 的 get() 方 法 并 得 到 返回 值 之 后 ， 两 者 之 间 的 连接 就 断 开 了 ， 
但 是 用 了 @tornado.web.asynchronous 之 后 ， 这 个 连接 束 不 关闭 ， 直 到 
执行 了 self.finish() 才 关闭 这 个 连接 。 


tornado.ioloop.IOLoop.instance().add_timeout0) 也 是 一 个 实现 异步 的 函 
数 ，time.time()+17 给 前 面 的 钞 数 提供 一 个 参数 ， 这 样 实现 了 相当 于 
time.sleep (17) 的 功能 ， 不 过 ， 还 没有 完成 ， 当 这 个 操作 完成 之 后 ， 
就 执行 回调 函数 on_response() 中 的 self.render ("sleep.html") ， 并 关闭 
连接 self.finish()。 


所 谓 异步 ， 就 是 要 解决 原来 的 time.sleep (17) 造成 的 服务 器 处 理 时 间 
长 、 性 能 下 降 的 问题 。 解 决 方法 如 上 描述 。 


读者 看 这 个 代码 ， 或 许 会 感觉 有 点 不 舒服 。 如 采 有 这 个 感觉 是 正常 
的 ， 因 为 它 里 面 除了 故 饰 锅 之 外 ， 用 到 了 一 个 回调 函数 ， 它 证 代码 的 
逻辑 不 是 平 铺 下 去 ， 而 是 被 分 割 成 了 两 段 。 第 一 段 是 
tornado.ioloop.IOLoop.instance().add_timeout (time.time()+17, 
callback=self.on_response) ， 用 callback=self.on_response 来 使 用 回调 画 
数 ， 并 没有 如 同 改造 之 前 直接 self.render ("sleep.html") ; 第 二 段 是 回 
调 函 数 on_response (self) ， 要 在 这 个 函数 里 面 执行 self.render 
("sleep.html") ， 并 且 以 self.finish()` 结 尾 以 关闭 连接 。 

这 还 是 执行 简单 逻辑 ， 如 果 复 杂 了 ， 要 不 断 地 进行 “回调 *"， 无 法 让 逻 
辑 顺 利 延 续 ， 残 会 < 胶 蛇 ”了 “。 这 种 现象 被 业界 称 为 “代码 逻辑 拆 分 ”， 
打破 了 原 有 逮 辑 的 顺序 性 。 为 了 让 代码 逻辑 不 至 于 被 拆 分 的 七 零 八 
沙 ， 于 是 就 出 现 了 男 外 一 种 常用 的 方法 : 


#!/usr/bin/env python 


# coding=utf-8 


import tornado.web 
import tornado.gen 


from base import BaseHandler 
import time 


class SleepHandler(tornado.web.RequestHandler): 
@tornado.gen.coroutine 
def get(self): 
yield tornado.gen.Task(tornado.ioloop.TIOLoop.instance().add timeout, time.time() + 17) 
#yield tornado.gen.sleep(17) 


从 整体 上 看 ， 这 段 代码 避免 了 回调 函数 ， 看 着 顺利 多 了 。 
再 看 细 广 部 分 。 
首先 使 用 的 是 @tornado.gen.coroutine 装 炳 器 ， 所 以 要 在 前 面 有 import 


tornado.gen。 跟 这 个 装饰 絮 类 似 的 是 @tornado.gen.engine 装 饰 嚣 ， 两 者 
功能 类 似 ， 有 一 点 细微 差别 。 请 阅读 官方 对 此 的 解释 ; 


This decorator ( 指 engine) is similar to coroutine, except it does not 
return a Future and the callback argument is not treated specially. 


@tornado.gen.engine 是 古 时 候 用 的 ， 现 在 我 们 都 使 用 
@tornado.gen.corroutine 了 ， 这 个 是 在 tornado 3.0 以 后 开始 用 的 。 在 网 
上 和 查阅 资料 的 时 候 ， 会 遇 到 一 些 使 用 @tornado.gen.engine 的 ， 但 是 在 
你 使 用 或 者 借鉴 代码 的 时 候 ， 可 以 勇敢 地 将 其 修改 为 
@tornado.gen.coroutine 。 有 了 这 个 装饰 器 ， 束 能 够 控制 下 面 的 生成 絮 
的 流程 了 。 


然后 就 看 到 get(0) 方 法 里 面 的 yield4 了 ， 这 是 一 个 生成 器 。*yield 
tornado.gen.Task (tornado.ioloop.IOLoop.instance(O.add_timeout, 
time.time()+17) ”的 执行 过 程 ， 先 看 括号 里 面 ， 跟 前 面 的 一 样 是 来 替代 
time.sleep (17) 的 ， 然 后 是 tornado.gen.Task() 方 法 ， 其 作用 是 “Adapts 
a callback-based asynchronous function for use in coroutines.”( 由 于 怕 翻 
译 后 遗漏 信息 ， 所 以 引用 原文 ) 。 返 回 后 ， 使 用 yield 得 到 了 一 个 生成 
堪 ， 移 把 流程 挂 起， 等 完全 完毕 再 唤 酝 继续 执行 。 要 提醒 读者 ， 生 成 
如 都 是 异步 的 。 


其 实 ， 上 面 虽 叶 了 一 堆 ， 可 以 用 代码 中 注释 的 一 句 话 来 代替 yield 
tornado.gen.sleep (17) ， 之 所 以 鹃 时 ， 就 是 为 了 顺便 看 到 
tornado.gen.Task() 方 法 ， 因 为 如 果 读 者 在 看 古老 的 代码 时 会 遇 到 。 但 
是 ， 后 面 你 写 的 时 候 ， 就 不 要 那么 虽 喧 了 ， 请 用 yield 


tornado.gen.sleep() ° 


至 此 ， 基 本 上 对 Tomado 的 异步 设置 有 了 概 咒 ， 不 过 ， 上 面 的 程序 在 实 
际 中 没有 什么 价值 。 在 工程 中 ， 要 让 Tornado 网 站 真正 异步 起 来 还 要 做 
不 仅仅 是 如 上 面 的 设置 ， 因 为 其 实 很 多 东西 都 不 是 异步 


在 研发 实践 中 ， 异 步 设 置 是 比较 复杂 的 ， 不 是 简单 地 完成 上 述 流程 吏 
行 了 。 比 如 以 下 各 项 中 ， 尽 管 你 已 经 完成 了 前 面 的 设置 ， 如 果 忽 视 了 
下 面 这 些 项 目 ， 那 么 tornado 的 非 阻塞、 异步 优势 章 减 了 。 


。 数据 库 的 所 有 操作 ， 不 管 你 的 数据 是 SQL 还 是 noSQL 、connect、 
insert、update 等 。 

。 文件 操作 ， 打 开 、 读 取 、 写 入 等 。 

。 time.sleep， 在 前 面 举 例 中 已 经 看 到 了 。 


。 smtplib， 发 邮件 的 操作 。 
。 一 些 网 络 操作 ， 比 如 tornado 的 httpclient 以 及 pycurl 等 。 


或 许 在 编程 实践 中 还 会 遇 到 其 他 的 同步 、 阻 蹇 实践 。 仅 仅 束 上 面 几 
项 ， 十 编程 实践 中 经 常会 遇 到 的 ， 怎 么 解决 ? 


聪明 的 大 牛 程序 员 帮 我 们 做 了 扩展 模块 ， 专 门 用 来 实现 异步 / 非 阻 塞 。 


。 在 数据 库 方 面 ， 由 于 种 类 繁多 ， 不 能 一 一 说 明 ， 比 如 MySQL， 可 
以 使 用 adb 模 块 来 实现 Python 的 异步 MySQL 库 ;对 于 mongodb 数 据 
库 ， 有 一 个 非常 优秀 的 模块 ， 专 门 用 于 在 Tornado 和 mongodb 上 实 
现 异 步 操 作 ， 它 就 是 motor。 下 面 特别 贴 出 它 的 Logo 。 

。 文件 操作 方面 也 没有 替代 模块 ， 只 能 尽量 控制 好 IO， 或 者 使 用 内 
存 型 (Redis) 及 文档 型 (MongoDB) 数据 库 。 

。 time.sleep() 在 Tornado 中 有 和 替代: tornado.gen.sleep0) 或 者 
tornado.ioloop.IOLoop.instance().add_timeout， 这 在 前 面 代 码 已 经 
显示 了 。 

。 smtp 发 送 邮件 ， 推 荐 改 为 tornado-smtp-client 。 

。 对 于 网 络 操作 ， 要 使 用 tornado.httpclient.AsyncHTTPClient 。 


其 他 的 解决 方法 ， 只 能 看 到 问题 具体 说 了 ， 甚 至 没有 很 好 的 解决 方 
法 。 不 过 ， 这 里 有 一 个 列表 ， 列 出 了 足够 多 的 库 ， 供 使 用 者 选择 : 
Async Client Libraries built on tornado.ioloop 

(https://github.com/tornadoweb/tornado/wiki/Links) ， 同 时 这 个 页 面 里 
面 还 有 很 多 别 的 链接 ， 都 是 很 好 的 资源， 建议 读 者 多 看 看 。 


到 这 里 ， 请 读者 思考 一 个 问题 ， 既 然 对 于 mongodb 有 专门 的 motor 库 来 
实现 异步 ， 前 面 对 于 Tornado 的 异步 ， 不 管 是 哪个 装 炳 器 ， 都 感觉 麻 
烦 ， 有 没有 专门 的 库 来 实现 这 种 异步 呢 ? 这 不 是 异想天开 ， 还 真有 。 
也 应 该 有 ， 因 为 这 才 体 现 Python 的 特点 。 比 如 greenlet-tornado 

(https://github.com/mopub/greenlet-tormado) 就 是 一 个 不 错 的 库 。 读 者 
可 以 浏 顺 官方 网 站 深入 了 解 。 


必须 声明 ， 前 面 演示 如 何在 Tornado 中 设置 异步 的 代码 ， 仅 仅 是 演示 设 
置 方法 。 在 工程 实践 中 ， 那 个 代码 的 意义 不 大 ， 为 此 ， 应 该 有 一 个 近 
似 于 实践 的 代码 示例 。 是 的 ， 的 确 应 该 。 当 我 正 要 写 这 样 的 代码 


时 ， 在 网 上 发 现 一 篇 文章 ， 这 篇 文章 阻止 了 我 写 下 去 ， 因 为 我 要 写 的 
内 容 那 篇 文章 的 作者 早 惑 写 好 了 ， 而 且 我 认为 表述 非常 到 位 ， 示 例 也 
详细 。 所 以 ， 我 不 得 不 放弃 ， 转 而 推荐 给 读者 这 篇 好 文章 : 


http:/emptysqua.re/blogrefactoring-tornado-coroutines/。 
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第 9 草 ” 科 学 计算 

有 朋友 问 ，Python 在 哪个 方面 能 让 我 感到 最 强悍 ? 我 回答 : 计算 。 如 
条 说 仅仅 要 做 一 个 实现 增删 改 查 功 能 的 网 站 ，PHP 也 是 很 好 的 选择 ， 


Python 也 没有 什么 太 让 人 惊叹 的 表现 。 但 若 要 进行 计算 ， 特 别 是 在 数 
据 分 析 、 机 器 学 习 等 方面 ，Python 的 表现 会 让 人 佩服 得 五 体 投 地 。 


因为 本 书 的 读者 是 初学 者 ， 这 里 所 谓 的 “科学 计算 ”， 仪 仪 古 给 读者 展 
示 一 个 简单 的 样子 ， 要 专业 研究 用 Python 进行 科学 计算 ， 还 请 读者 参 
阅 有 关 专 门 的 书籍 。 


9.1 为 计算 做 准备 
9.1.1 闲谈 


计算 机 嫩 奶 是 擅长 进行 科学 计算 的 ， 本 来 她 融 是 做 这 个 的 ， 只 不 过 后 
来 人 们 让 她 处 理 了 很 多 文字 内 容器 了 ， 旋 至 于 现在 有 一 些 人 认为 她 是 
用 来 打字 写 文章 的 ， 却 瑟 记 了 她 最 擅长 的 计算 。 


每 种 编程 语言 都 能 用 来 做 计算 ， 区别 是 在 编程 过 程 中 是 否 有 足够 的 工 
具 包 供给 。 比 如 ， 用 汇编 就 得 目 己 多 劳动 ， 如 果 用 Fortran， 束 方便 多 
了 。 不 知道 读者 是 否 听 说 过 Fortran， 貌 似 古 者， 但 现在 仍 被 使 用 (以 
下 引文 均 来 自 维 基 百 科 ) 。 


Fortran 语 言 是 为 了 满足 数值 计算 的 需求 而 发 展 出 来 的 。1953 年 12 月 ， 
IBM 公 司 工程 师 约翰 : 巴 科 斯 (J.Backus) 因 深 深 体 会 编写 程序 很 困 
难 ， 而 写 了 一 份 备 坊 录 给 董事 长 斯 伯 特 : 赫 德 (Cuthbert Hurd) ， 建 议 
为 IBM704 系 统 设计 全 新 的 计算 机 语言 以 提升 开发 效率 。 当 时 IBM 公 司 
的 顾问 冯 : 诺 伊 曼 强 烈 反 对 ， 因 为 他 认为 不 切实 际 而 且 根 本 不 必要 。 但 
赫 德 批准 了 这 项 计划 。1957 年 ，IBM 公 司 开发 出 第 一 套 Fortran 语 言 ， 
在 IBM704 计 算 机 上 运作 。 历 史上 第 一 支 Fortran 程 序 在 蕊 里 兰州 的 西屋 
贝 地 斯 核电 厂 试验 。1957 年 4 月 20 日 星期 五 的 下 午 ， 一 位 IBM 软 件 工程 


师 决 定 在 电厂 内 编译 第 一 支 Fortran 程 序 ， 当 程序 代码 输入 后 ， 经 过 编 
译 ， 打 印 机 列 出 一 行 讯 县 : “原始 程序 错误 ..….. 右 侧 括 号 后 面 没 有 过 
号 ”， 这 让 现场 人 员 都 感到 惊讶 ， 修 正 这 个 错误 后 ， 打 印 机 输出 了 正确 
结果 。 而 西屋 电气 公司 因此 意外 地 成 为 Fortran 的 第 一 个 商业 用 户 。 
1958 年 推出 Fortranll， 几 年 后 又 推出 Fortran 川 ， 在 1962 年 推出 FortranlV 
后 ， 开 始 被 广泛 使 用 。 目 前 最 新 版 是 Fortran 2008 。 


二 有 二 个 优 广 为 应 用 的 语言 不 得 不 说 ， 那 束 是 MATLAB， 一 直 以 来 被 


小 于 © 


MATLAB (矩阵 实验 室 ) 是 MATrix LABoratory 的 缩写 ， 是 一 款 由 美国 
The MathWorks 公 司 出 品 的 商业 数学 软件 。MATLAB 是 一 种 用 于 算法 
开发 、 数 据 可 视 化 、 数 据 分 析 以 及 数值 计算 的 高 级 技术 计算 语言 和 区 
互 式 环境 。 除 了 矩阵 运算 、 绘 制 丁 数 /数据 图 像 等 常用 功能 外 ， 
MAILAB 还 可 以 用 来 创建 用 户 界面 及 调用 其 他 语言 (包括 C、C++、 
Java、Python 和 Fortran) 编写 的 程序 。 


但 是 ， 它 是 收费 的 商业 软件 ， 虽 然 在 个 别 国 家 并 不 受到 收费 影响 。 
还 有 R 语 言 ， 也 是 在 计算 领域 被 广泛 使 用 的 。 


R 语 言 ， 一 种 自由 软件 程序 语言 与 操作 环境 ， 主 要 用 于 统计 分 析 、 绘 
、 数据 挖 气 。R 本 来 是 由 来 自 新 西 兰 奥 元 兰 大 学 的 Ross Ihaka 和 
Robert Gentleman 开 发 (也 因此 称 为 R) ， 现 在 由 “R 开 发 核心 团队 ” 负 
责 开 发 。R 是 基于 S$ 语言 的 一 个 GNU 计 划 项 目 ， 所 以 也 可 以 当 作 S 语 言 
的 一 种 实现 ， 通 常用 S 语 言 编写 的 代码 都 可 以 不 做 修改 地 在 R 环 境 下 运 
行 。R 的 语法 是 来 自 Scheme 。 


最 后 要 说 的 就 是 Python， 近 几 年 使 用 Python 的 领域 不 断 扩 张 ， 包 括 在 
科学 计算 领域 ， 它 已 经 成 为 了 一 种 趋势 。 在 这 个 过 程 中 ， 虽 然 有 不 少 
人 诉 病 Python 慢 、 解 释 动 态 语言 之 类 (这 种 说 法 是 值得 讨论 的 ) ， 但 
依然 无 法 阻挡 Python 在 科学 计算 领域 大 行 其 道 。 之 所 以 这 样 ， 束 是 因 
为 它 是 Python， 天 生 骄 傲 。 


。 开 源 ， 束 这 一 条 已 经 足够 了 ， 一 定 要 用 开源 的 东西 。 
。 人 所 以 有 非常 棒 的 社区 ， 里 面 有 相当 多 文 持 科学 计算 的 
车 Oo 


。 简 单 易 学 ， 这 一 点 对 那些 不 是 专业 的 程序 员 来 讲 非常 重要 。 接 触 
过 一 些 搞 天 文学 和 生物 学 的 研究 者 ， 他 们 也 正在 使 用 Python 进行 


计 
。 在 科学 计算 上 如 果 使 用 Python， 能 够 让 数据 与 其 他 领域 比如 Web 
无 颖 对 接 。 


当然 ， 最 重要 一 点 是 本 书 是 讲 Python 的 ， 所 以 ， 在 科学 计算 这 块 肯 定 
不 会 讲 Fortran 或 者 R， 而 是 会 讲 Python 。 


9.1.2 安装 
如 果 读 者 使 用 Ubuntu 或 者 Debian， 可 以 这 样 来 安装 : 


sudo apt-get install python-numpy python-scipy python-matplotlib ipython 
ipython-notebook python-pandas python-sympy python-nose 


一 股 脑 把 可 能 用 上 的 都 和 完 淡 上 。 在 安装 的 时 候 ， 如 采 和 需要 其 他 依赖 ， 
你 会 明显 看 到 的 。 


如 果 是 别 的 系统 ， 比 如 Windows， 请 目 己 去 网 上 查找 安装 方法 吧 ， 最 
权威 的 是 看 官方 网 站 列 出 的 安装 : http://www.scipy.org/install.html 。 


9.1.3 ”基本 操作 


在 科学 计算 中 ， 业 界 比 较 喜 欢 使 用 ipython notebook， 前 面 已 经 有 安 
装 。 在 shell 中 执行 : 


ipython notebook--pylab=inline 
得 到 如 图 9-1 所 示 的 界面 ， 这 是 在 浏 蜗 絮 中 打开 的 。 


127.0.0.1 S555)/ 6775 4061-9345-C4e8ec7| a vy C| Q search 


IPry: Notebook ven | ee 


Notebook 
rn [ J: || 


| 
Lipynb _ 二 


| Markdown 


| ClearAl 


Autoindent: 


图 9-1 在 浏览 器 中 打开 界 下 


在 mm 后 面 的 编辑 区 ， 可 以 写 Python 语 句 。 然 后 按 下 SHIFT+ENTER 或 者 
CTRL+ENTER 组 合 键 就 能 执行 了 ， 如 果 按 下 ENTER 键 ， 则 不 是 执 
行 ， 而 是 在 当前 编辑 区 换行 。 


Ipython Notebook 是 一 个 非常 不 错 的 编辑 器 ， 执 行 之 后 ， 直 接 显 示 出 来 
输入 的 内 容 和 输出 的 结果 。 当 然 ， 错 误 是 难免 的 ， 如 图 9-2 所 示 。 


port random 
a = [randon.randint(19 
print za 


TypeError Traceback (most recent call last) 
/home/qw/Documents/StarterLearningPython/<ipython-input-9-44c3f4798939> in <mo 中 
1 import random 
->2a= [random.randintI19)] 
3 print a 


TypeError: randint() takes exactly 3 arguments (2 given) 


图 9-2 ”显示 内 容 


注意 观察 图 中 的 箭头 所 指 ， 直 接 标 出 有 问题 的 行 。 返 回 编辑 区 ， 修 改 
之 后 可 继续 执行 。 


不 要 忽视 左边 的 辅助 操作 ， 它 能 够 让 你 在 使 用 ipython notebook 的 时 候 
更 方便 ， 如 图 9-3 所 示 。 


TEDoOoOF 
— 


TIPIY: Notebook 


Autoindent 匡 
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Kill kernel upon exit 门 ] 


Thr 


Shift-Enter : run selected cell 
Ct-Enter : run selected cell in-place 
CH-mh : show keyboard shortcuts 


图 9-3 ”左边 的 辅助 操作 


除了 在 网 页 中 之 外 ， 如 果 你 已 经 喜欢 上 了 Python 的 交互 模式 ， 特 别 是 
你 用 的 计算 机 中 有 shell， 那 束 更 棒 了 “。 于 是 可 以 : 


$ ipython 


进入 了 一 个 类 似 于 Python 的 交互 模式 中 ， 如 下 所 示 : 


In [1]: print "hello, pandas" 


hello, pandas 


或 者 说 ipython 同 样 是 一 个 不 错 的 交互 模式 。 
9.2 Pandas 


Pandas 是 基于 NumpPy 的 一 个 非常 好 用 的 库 ， 正 如 名 字 一 样 ， 人 见 人 
Se 之 所 以 如 此 ， 是 因为 不 论 是 读 取 还 是 处 理 数据 ， 用 它 都 非常 简 


9.2.1 基本 的 数据 结构 


Pandas 有 两 种 目 己 独 有 的 基本 数据 结构 。 读 者 应 该 注意 的 是 ， 它 固然 
有 着 两 种 数据 结构 ， 因 为 它 依然 是 Python 的 一 个 库 ， 所 以 ，Python 中 
有 的 数据 类 型 在 这 里 依然 适用 ， 同 样 还 可 以 使 用 类 目 己 定义 数据 类 
型 。 不 过 ，Pandas 里 面 又 定义 了 两 种 数据 类 型 : Series 和 DataFrame， 
它们 让 数据 操作 更 简单 。 


以 下 操作 都 是 基于 如 下 模块 导入 : 


In [1]: from pandas Import Series, DataFrame 
Import pandas as pd 


为 了 省 事 ， 后 面 就 不 再 显示 了 “。 如 果 你 跟 我 一 样 是 使 用 的 ipython 
notebook， 只 需要 开始 引入 模块 即 可 。 


e 9erles 


Series 如 同 列表 一 样 ， 有 一 系列 数据 ， 每 个 数据 对 应 一 个 索引 值 。 比 如 
这 样 一 个 列表 [9，3，8]， 如 有 果 跟 索引 值 写 到 一 起 ， 束 有 古 : 


上 面 两 种 ， 只 是 表现 形式 上 的 差别 妥 了 。 


Series 束 是 “ 坚 起 来 ”的 list: 


In [2]: s = Series([160, "PYTHON", "Soochow", "Qiwsir"]) 
S 


Out[2]: 9 100 
1 PYTHON 
2 Soochow 
3 


Qiwsir 


男 外 一 点 也 很 像 列表 ， 束 是 其 中 元 素 的 类 型 由 你 任意 决定 (其 实 是 由 
需要 来 决定 ) 。 


这 样 ， 我 们 就 创建 了 一 个 Series 对 象 ， 这 个 对 象 有 其 属性 和 方法 。 比 
如 ， 下 面 的 两 个 属性 依次 可 以 显示 Series 对 象 的 数据 值 和 索引 : 


In [3]: s. 国 ET 下 
Out[3]: array([1990，“ "PYTHON' ，'Soochow'， 'Qiwsir']，dtype=object) 
In [4]: |5. 


Out[4]: Int64Index([9, 1, 2, 3], dtype=int64) 


列表 的 索引 只 能 是 从 0 开始 的 整数 ， 在 默认 情况 下 ，Series 数 据 类 型 其 
索引 也 是 如 此 。 但 区 别 于 列表 的 是 ，Series 可 以 目 定 义 索引 : 


s2 = Series([199，"PYTHON"，"Soochow"，"Qiwsir"]，index=["mark"，"titLe"，"uUniversity"，"name"]) 
2 


k 109 
titl PYTHON 
university Soochow 

Qiw 


每 个 元 素 都 有 了 索引 ， 束 可 以 根据 索引 操作 元 素 了 。 还 记得 list 中 的 操 
1 ee 类 似 的 操作 。 欧 看 简单 的 ， 根 据 索引 查看 其 值 和 
牙 改 其 但 : 


In [7]: 


Out[7]: 'Qiwsir' 


In [8]: 

In [9] : 

Out[9]: mark 100 
title PYTHON 
university Soochow 
name AOI 


这 是 不 是 又 有 点 类 似 dict 数 据 ? 的 确 如 此 ， 看 下 面 就 理解 了 。 


前 面 定义 Series 对 象 的 时 候 ， 用 的 是 列表 ， 即 Series() 方 法 的 参数 中 第 
一 个 列表 就 是 其 数据 值 ， 如 果 需 要 定义 index， 放 在 后 面 依 然 是 一 个 列 
表 。 除 了 这 种 方法 之 外 ， 还 可 以 用 下 面 的 方法 定义 Series 对 象 : 


In [15]: sd = {"python":8000, "c++":8100, "Cc#":4000} 
s4 = Series(sd) 
s4 


OuttlsSjs cs 4000 
C++ 8100 
python 8009 


人 因为 本 来 吏 定 可 以 这 样 定义 


这 时 候 ， 索 引 依然 可 以 自 定 义 。Pandas 的 优势 在 这 里 体现 出 来 ， 如 果 
目 定 义 了 索引 ， 目 定义 的 索引 会 目 动 寻 找 原 来 的 和 索引。 如果 一 样 ， 丈 
取 原 来 索引 对 应 的 值 ， 这 个 可 以 简称 为 < 目 动 对 齐 ”。 


In [19]: s6 = Series(sd, index=["java","python","c++","Cc#"]) 
s6 


Out[19]: java NaN 
python 8069 
C 十 十 8100 
C# 4000 


在 sd 中 ， 只 有 “python':8000，'c++":8100，'c##:4000”， 没 有 “java”， 但 
是 在 索引 参数 中 有 ， 于 是 其 他 能 够 “自动 对 齐 ” 的 照搬 原 值 ， 没 有 的 那 
个 *java” 依 然 在 新 Series 对 象 的 索引 中 存在 ， 并 且 上 自动 为 其 赋值 NaN 。 
在 Pandas 中 ， 如 果 没 有 值 ， 都 对 齐 赋 给 NaN。 下 面 来 一 个 更 特殊 的 : 


In [17]: ilst = ["java", "perl"] 
s5 = Series(sd,index=ilst) 
S5 


Out[17]: java NaN 
perl NaN 


新 得 到 的 Series 对 象 索引 与 sd 对 象 一 个 也 不 对 应 ， 所 以 都 是 NaN 。 
Pandas 有 专门 的 方法 来 判断 值 是 否 为 空 。 


In [26] : 


Out[20]: java 


ET L211]: 


python 
C 十 十 
C# 


Out[21]: java 


python 
C++ 
C# 


此 外 ，Series 对 象 也 有 同样 的 方法 : 


In [22]: 


0ut[22] : 


s6.isnull() 


java True 
python False 
C++ False 
C# False 


其 实 ， 对 索引 的 名 字 是 可 以 重新 定义 的 : 


In [38]: ls6cindex =°" pi” “p22” 


s6 


Out[38]: pl 


对 于 Series 数 据 ， 也 可 以 做 类 似 下 面 的 运算 : 


NaN 
8009 
8160 
4009 


pd.isnull(s6) 


True 


False 
False 
False 


TT 


pd.notnull(s6)| 


False 


True 
True 
True 


3 ; my 


In [16]: | 3 = Series([3,9,4,7], index=[ "a b's'c','d']) 
号 


Out[19] : 


ONTo 
局 上 加 W 


In [11l: | 国王 [35 


Out[11]: b 9 
d 7 


Tm [L121]: 

0ut[12]: a 15 
b 45 
i 20 
d 35 


上 面 的 演示 都 是 在 ipython notebook 中 进行 的 ， 所 以 截图 了 。 在 学 习 
Series 数 据 类 型 的 同时 了 解 了 ipyton notebook。 对 于 后 面 的 所 有 操作 ， 
读者 都 可 以 在 ipython notebook 中 进行 ， 也 可 以 在 Python 交互 模式 中 进 
行当 

。 DataFrame 


DataFrame 是 一 种 二 维 的 数据 结构 ， 非 党 接近 于 电子 表格 或 者 类 似 
MySQL 数 据 库 的 形式 。 它 的 竖 行 称 之 为 columns， 横 行 跟前 面 的 Series 
一 样 ， 称 之 为 Index， 世 就 是 说 可 以 通过 columns 和 index 来 确定 一 个 主 
句 的 位 置 。 


cl c3 c4 columMns 
de 
ix2 
ixd 

index 


下 面 的 演示 在 Python 交互 模式 下 进行 ， 读 者 仍然 可 以 在 ipython 
notebook 环 境 中 测试 。 


>>> import pandas as pd 


>>> from pandas import Series，DataFrame 


>>> data = {"name":["yahoo","google","facebook"], "marks":[200,400,800], "price":[9, 3, 7]} 


>>> f1 = DataFrame(data) 


>>> Tf1 
marks name price 
0 200 yahoo 9 


4 400 google 3 


800 facebook 7 


这 古 定 义 一 个 DataFrame 对 象 四 第 弟 用 方法 一 一 使 用 dict 定 义 。 字 典 

的 “ 键 ” ("name"，"marks"，"price") 就 是 DataFrame 的 columns 的 值 
名称) ， 字典 中 每 个 “ 键 "的 “ 值 ” 是 一 个 列表 ， 它 们 吏 是 那 一 竖 列 中 

的 填充 数据 。 上 面 的 定义 中 没有 确定 索引 ， 所 以 ， 按 照 惯 例 (Series 中 

已 经 形成 的 次 例 ) 就 是 从 0 开始 的 整数 。 从 上 面 的 结果 中 很 明显 表示 出 

二 这 就 是 一 个 二 维 的 数据 结构 类似 Excel 或 者 MySQL 中 的 查看 效 


上 面 的 数据 显示 中 ，columns 的 顺序 没有 规定 ， 残 如 同 字 典 中 键 的 顺序 
一 样 ， 但 是 在 DataFrame 中 ，columns 跟 字典 键 相 比 ， 有 一 个 明显 不 
同 ， 束 是 其 顺序 可 以 被 规定 ， 如 下 所 示 : 


>>> f2 = DataFrame(data, columns=['name', 'price', 'marks']) 


>>> f2 
name price marks 
9 yahoo 9 200 
J google a 400 
2 facebook 7 800 


跟 Series 类 似 ，DataFrame 数 据 的 索引 也 能 够 自 定 义 。 


>>> f3 = DataFrame(data, columns=['name', 'price', 'marks', 'debt'], index=['a','b', 'c','d']) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "/usr/lib/pymodules/python2.7/pandas/core/frame.py", line 283, in _ init _ 
mgr = self._init_dict(data, index, columns, dtype=dtype) 
File "/usr/lib/pymodules/python2.7/pandas/core/frame.py", line 368, in _init_dict 
mgr = BlockManager (blocks, axes) 
File "/usr/lib/pymodules/python2.7/pandas/core/internals.py", line 285, in _ init _ 


self._ verify_integrity() 


File "/usr/lib/pymodules/python2.7/pandas/core/internals.py", line 367, in _verify_integrity 
assert(block.values.shape[1:] == mgr_shape[1:]) 


AssertionError 


报错 了 。 这 个 报错 信息 太 不 友好 了 ， 也 没有 提供 什么 线索 ， 这 职 是 交 
互 模式 的 不 利之 处 。 修 改 之 ， 错 误 在 于 index 的 值 一 一 列表 ， 其 数据 项 
多 了 一 个 ，data 中 是 三 行 ， 这 里 给 出 了 四 个 项 (['a', 'b', 'c', 'd']) 。 


>>> f3 = DataFrame(data, columns=['name', 'price', 'marks', 'debt'], index=['a','b','c']) 
>3% TF3 
name price marks debt 
a yahoo 9 200 NaN 
b google 3 400 NaN 
c facebook 汉 800 NaN 


读者 还 要 注意 观察 上 面 的 显示 结果 。 因 为 在 定义 人 B 的 时 候 ，columns 的 
参数 中 比 以 往 多 了 一 项 (debt) ， 但 是 这 项 在 data 这 个 字典 中 并 没 
有 ， 所 以 debt 这 一 坚 列 的 值 都 是 空 的 ， 在 Pandas 中 ， 空 束 用 NaN 来 代表 
本 O 


lang 和 
firstline pyth 8000 
Secon dline java NaN 


在 字典 中 就 规定 好 数列 名 称 《第 一 层 键 ) 和 每 横行 索引 (第 二 层 字典 
键 ) 以 及 对 应 的 数据 〈 第 二 层 字 典 值 ) ， 即 在 字典 中 规定 好 每 个 数据 
格子 中 的 数据 ， 没 有 规定 的 部 是 空 。 


DataF (newdata, ind ["firstl condline", "thirdline"]) 
lang pric 
firstline pyth 8000 
secon dline jav NaN 
thirdline NaN NaN 


如 果 额 外 确定 了 索引 ， 束 如 同上 面 显 示 的 一 样 ， 除 非 在 字典 中 有 相应 
的 索引 内 容 ， 否 则 都 是 NaN 。 


前 面 定 义 了 DataFrame 数 据 ， 它 也 是 一 种 对 象 类 型 ， 比 如 变量 f3 引 用 了 
人 它 的 类 型 是 DataFrame。 承 接 以 前 的 思维 方法 : 对 象 有 属性 
万 法 


>>> f3.columns 


Index(['name', 'price', 'marks', 'debt'], dtype=object) 


DataFrame 对 象 的 columns 属 性 能 够 显示 素 有 的 columns 名 称 ， 并 且 ， 还 
能 用 下 面 类 似 字 典 的 方式 得 到 某 坚 列 的 全 部 内 容 (当然 包含 索引 ) : 


>>> f3['name'] 


a yahoo 
b google 
facebook 


Name: name 


这 其 实 束 是 一 个 Series， 或 者 说 ， 可 以 将 DataFrame 理 解 为 是 由 一 个 一 
个 的 Series 组 成 的 。 


一 直 耿 耿 于 怀 没 有 数值 的 那 一 列 ， 下 面 的 操作 是 统一 给 那 一 列 赋值 : 


>>> f3['debt'] = 89.2 


>>> f3 

name price marks debt 
a yahoo 9 200 89.2 
b google 名 400 89.2 
c facebook 800 89.2 


除了 能 够 统一 赋值 之 外 ， 还 能 够 “点 对 点 ”添加 数值 ， 结 合 前 面 的 
Series， 既 然 DataFrame 对 和 象 的 每 竖 列 都 是 一 个 Series 对 象 ， 那 么 可 以 先 
定义 一 个 Series 对 象 ， 然 后 把 它 放 到 DataFrame 对 象 中 。 如 下 : 


>>> sdebt = Series([2.2, 3.3], index=["a","c"]) # 注 意 索引 


>>> f3['debt'] = sdebt 


将 Series 对 象 (sdebt 变 量 所 引用 ) 赋 给 f3['debt'] 列 ，Pandas 的 一 个 重要 
特性 一 一 上 自动 对 齐 ， 在 这 里 起 做 用 了 ， 在 Series 中 ， 只 有 两 个 索引 
("a", "ec") ， 它 们 将 和 DataFrame 中 的 索引 自动 对 齐 。 于 是 平 : 


>>> f3 


name price marks debt 


a yahoo 9 200 2:2 
b google 3 400 NaN 
c facebook 7 800 3352 


目 动 对 齐 之 后 ， 没 有 被 复制 的 依然 保持 NaN 。 


还 可 以 更 精准 地 修改 数据 吗 ? 当然 可 以 ， 完 全 仿照 字典 的 操作 : 


这 些 操作 是 不 是 都 不 陌生 ? 这 就 是 Pandas 中 的 两 种 数据 对 象 。 
9.2.2 读 取 CSV 文 件 


因为 篇 幅 限 制 ， 不 能 将 有 关 Pandas 的 内 容 完全 详细 讲述 ， 只 能 “ 抛 砖 引 
玉 ”， 同 大 家 做 一 个 简单 介绍 ， 说 明 其 基本 使 用 方法 。 当 读者 在 实践 中 
HU 如 采 遇 到 问题 ， 可 以 结合 相关 文档 或 者 通过 搜索 来 解 

1 大 5 


1. 关 于 CSV 文 件 


CSV 是 一 种 通用 的 、 相 对 简单 的 文件 格式 ， 在 表格 类 型 的 数据 中 用 途 
很 广泛 ， 很 多 关系 型 数据 库 都 文 持 这 种 类 型 文件 的 寻 入 导出 ， 并 且 
Excel 这 种 利用 的 数据 表格 也 能 和 CSV 文 件 之 间 转 换 。 


喜 号 分 隔 值 (Comma-Separated Values，CSV， 有 时 也 称 为 字符 分 隅 
值 ， 因 为 分 隔 字符 也 可 以 不 是 逗号 ) ， 其 文件 以 纯 文 本 形式 存储 表格 
数据 (数字 和 文本 ) 。 纯 文本 意味 着 该 文件 是 一 个 字符 序列 ， 不 合 必 
须 像 二 进 制 数字 那样 被 解读 的 数据 。CSV 文 件 由 任意 数目 的 记录 组 
成 ， 记 录 间 以 某 种 换行 符 分 隔 ; 每 条 记录 由 字段 组 成 ， 字 段 间 的 分 隔 
符 是 其 他 字符 或 字符 串 ， 最 常见 的 是 逗号 或 制 表 符 。 通 常 ， 所 有 记录 
都 有 完全 相同 的 字段 序列 。 


从 上 述 维 基 百 科 的 叙述 中 ， 重点 要 解读 出 “字段 间 分 隔 符 ” 和 "最 常见 的 
是 逗号 或 制 表 符 ”， 当 然 ， 这 种 分 隅 符 也 可 以 自行 制定 。 比 如 下 面 这 个 
我 命名 为 marks.csv 的 文件 ， 就 是 用 逗号 (必须 是 半角 的 ) 作为 分 隔 
符 : 


name, physics, python,math, english 
Google, 100, 100, 25, 12 
Facebook, 45, 54, 44, 88 


Twitter, 54,76, 13, 91 


Yahoo, 54, 452, 26, 100 


其 实 ， 这 个 文件 要 表达 的 事情 是 (如 果 转 化 为 表格 形式 ) : 


点 B C 


nanme physics python math [english 
Google 100 100 J 


Facebook 49 5 88 
TviTter Ek: ?6 91 
Yahoo 5 492 100 


最 简单 、 最 直接 的 束 古 用 村 计件 
、 w 
又 间 又 且 坊 的 踊 open() | 
>>> with open("./marks.csv") as f: 
for line in f: 
print line 
name, physics, python,math, english 
Google, 100, 100, 25, 12 
Facebook, 45, 54, 44, 88 


Twitter, 54,76, 13, 91 


Yahoo, 54, 452, 26, 100 


此 方法 可 以 ， 但 略 显 麻 烦 。 
Python 中 还 有 一 个 CSV 的 标准 库 ， 足 可 见 CSV 文 件 的 使 用 频繁 了 。 


>>> import csv 


>>> dir(csv) 


上 Dialect', "DictReader ' DietWrIter "Error' "QUOTES ALL' i MINIMAL', 'QUOTE_ NONE', 'QUOTE NONNUMERIC', 'Snif 
file 


fer' "Stri ingI0', '_Dialect', al RS builtins Re do -1 ' name_'， '_ package ', '__version_ 
“excel' 'excel tab', 'field_ size limit', 'get dialect' St dialects', 're', 'reader', 'reduce', 'register_dial 
sct， "unregister_， dialect', "writer '] 


什么 时 候 也 不 要 起 记 这 种 最 佳 学 习 方 法 。 从 上 面 的 结果 可 以 看 出 CSV 
模块 提供 的 属性 和 方法 。 仅 仅 驶 读 取 本 例子 中 的 文件 : 


>>> import csv 


>>> csv_reader = csv.reader(open("./marks.csv")) 


>>> for row in csv_reader : 


print row 


['name', "physics'， 'python', "math'， "english '] 
['Google', '100', '100', '25', '12'] 
['Facebook', '45', '54', '44', '88'] 
['Twitter', '54', '76', '13', '91'] 


算是 稍 有 改善 。 
如 条 对 上 面 的 结 采 都 不 满意 的 话 ， 那 么 看 看 Pandas 的 效果 : 


>>> import pandas as pd 


i 


>>> marks = pd.read_csv("./marks.csv") 
>>> marks 


name physics python math english 


0 Google 100 100 25 4 
1 Facebook 45 54 44 88 
2 Twitter 54 76 13 91 
3 Yahoo 54 452 26 100 


看 了 这 样 的 结 未 ， 你 还 不 感到 尺 诈 吗 ? 你 还 不 喜欢 Pandas 吗 ”这 征 
么 精妙 的 显示 ， 它 束 古 一 个 DataFrame 数 据 。 
还 有 男 外 一 种 方法 : 


>>> pd.read_ table("./marks.csv", sep=",") 


name physics python math english 


0 Google 100 100 25 12 
1 Facebook 45 54 44 88 
2 Twitter 54 76 13 91 
3 Yahoo 54 452 26 100 


多 


如 果 你 有 足够 的 好 奇 心 来 研究 这 个 名 叫 DataFrame 的 对 象 ， 可 以 这 样 : 


>>> dir(marks) 


['T', '_AXIS ALIASES', '_AXIS NAMES', '_AXIS NUMBERS', '_ add _ ', '_and ', '_array_ ', '_array wrap ', '_ class 


Se ontaine .rt. delattrs 1 "Uelitem ot oordiv .+ .Tarmat 
1 


人 eh ty Ni 


出 n modu mu n new nonzero 站 六 二 

ter ', ' le ',' le eT odule ,i! 和 e_', ' ne 和 由 n a r 

加 W ra iv. reduc reduce_ex r. oordiv mu W 
ol a Ls OS EE os i EUUCE yy 2 educe_e i -rflioord I 


人 


subclasshook ', '_ truediv ', ' weakref ', '_ xor_', '_agg_by_level', '_align frame', '_align_ series', '_apply_br 
oadcast', '_apply_raw', '_apply_standard', '_auto consolidate', '_bar_plot', '_boolean set', '_box_item values', '_cle 
ar_item cache', '_combine const', '_combine frame', '_combine match_columns', '_combine match_index', '_combine_series 


', '_combine_series_infer', '_compare_ frame', '_consolidate inplace', '_constructor', '_count_level', '_cov_helper', 


_data', '_default_stat axis', '_expand axes', '_from axes', '_get agg axis', '_get axis', '_get axis name', '_get_ axis 


_Nnumber', '_get_item cache', '_get_ numeric data', '_getitem array', '_getitem multilevel', '_helper_csvexcel', '_het 


和 


xis', '_indexed_ same', '_init dict', '_init mgr', '_init_ndarray', '_is mixed_ type', '_item cache', '_ix', '_join_comp 
at', '_reduce', '_reindex axis', '_reindex_ columns', '_reindex_index', '_reindex with_indexers', '_rename columns_inpl 
ace', '_rename_index_inplace', '_sanitize column', '_series', '_set axis', '_set_item', '_set_item multiple', '_shift_ 


indexer', '_slice', '_unpickle frame compat', '_unpickle matrix_compat', '_verbose_info', '_wrap_array', 'abs', "add'， 
'add_prefix', 'add_suffix', 'align', 'append', 'apply', 'applymap', 'as_matrix', 'asfreq', 'astype', 'axes', 'boxplot 


', 'clip', 'clip_lower', 'clip_upper', 'columns', 'combine', 'combineAdd', 'combineMult', "combine_first'， 'consolidat 
e', "convert_objects'， 'copy', 'corr', 'corrwith', 'count', 'cov', 'cummax', 'cummin', 'cumprod', 'cumsum', 'delevel', 

"describe'， 'diff', 'div', 'dot', 'drop', 'drop_duplicates', 'dropna', 'dtypes', 'duplicated', 'fillna', 'filter', 'f 
irst_valid_ index', 'from csv', 'from dict', 'from items', 'from records', 'get', 'get_dtype counts', 'get value', 'gro 
upby', 'head', 'hist', 'icol', 'idxmax', 'idxmin', 'iget value', 'index', 'info', 'insert', 'irow', 'iteritems', 'iter 
kv', 'iterrows', 'ix', 'join', 'last_valid_ index', 'load', 'lookup', 'mad', 'max', 'mean', 'median', "merge'， ‘'min', ' 
mul', 'ndim', "pivot'， "pivot_table'， 'plot', 'pop', "prod'， 'product', 'quantile', 'radd', 'rank', 'rdiv', 'reindex', 

'reindex_axis', 'reindex_like', 'rename', 'rename axis', 'reorder_levels', 'reset_index', 'rmul', 'rsub', 'save', 'se 
lect', 'set_index', 'set_value', 'shape', 'shift', 'skew', 'sort', 'sort_index', 'sortlevel', 'stack', 'std', 'sub’', 
sum', 'swaplevel', 'tail', 'take', 'to_csv', 'to_dict', 'to_excel', 'to_html', 'to_panel', 'to_records', 'to_sparse', 
'to_string', 'to wide', 'transpose', 'truncate', 'unstack', 'values', 'var', 'xs'] 


一 个 一 个 浏览 一 下 ， 通 过 名 字 可 以 知道 那个 方法 或 者 属性 的 大 概 ， 然 
后 束 可 以 根据 你 目 己 的 喜好 和 需要 ， 试 一 试 : 


>>> marks.index 


Int64Index([0, 1, 2, 3], dtype=int64) 

>>> marks.columns 

Index([name, physics, python, math, english], dtype=object) 
>>> marks['name'][1] 


"Facebook ' 


这 几 个 是 让 你 回忆 一 下 前 面 的 。 从 DataFrame 对 象 的 属性 和 方法 中 找 一 
个 ， 再 尝试 : 


>>> marks.sort(column="python") 


name physics python math english 


1 Facebook 45 54 44 88 
2 Twitter 54 76 13 91 
9 Google 100 100 2 12 
3 Yahoo 54 452 26 100 


按照 坚 列 “python” 的 值 排 队 ， 结 果 也 是 很 让 人 满意 的 。 下 面 儿 个 操 
作 ， 也 是 利用 到 的 ， 并 且 秉 水 了 Python 的 一 贯 方法 : 


>>> marks[:1] 
name physics python math english 
0 Google 100 100 25 12 
>>> marks[1:2] 
name physics python math english 
1 Facebook 45 54 44 88 


>>> marks["physics"] 


9 100 
1 45 
2 54 
3 54 


Name: physics 


可 以 说 ， 当 你 已 经 掌握 了 通过 dir0 和 helpO 查 看 对 象 的 方法 和 属性 时 ， 
就 已 经 掌握 了 Pandas 的 用 法 ， 其 实 何止 Pandas， 其 他 对 象 都 是 如 此 。 


2. 读 取 其 他 格式 数据 


CSV 是 常用 来 存储 数据 的 格式 之 一 ， 此 外 常用 的 还 有 MS Excel 格 式 的 
以 及 JSON 和 XML 格式 的 数据 等 ， 它 们 都 可 以 使 用 Pandas 来 轻易 
读 取 。 


在 下 面 的 结果 中 寻 砚 一 仆 ， 有 没有 跟 Excel 有 关 的 方法 。 


>>> dir(pd) 


['DataFrame', 'DataMatrix', "Dateoffset'， 'DateRange', 'ExcelFile', "EXxcelwriter'， 'Factor', 'HDFStore', 'Index', 'Int 


64Index', 'MultiIndex', 'Panel', 'Series', 'SparseArray', 'SparseDataFrame', 'SparseList', 'SparsePanel', 'SparseSerie 
Ss', 'SparseTimeSeries', 'TimeSeries', 'WidePanel', '_ builtins ', '_doc _', '_docformat__', '_file_', '_name_', 

'_package _', '_path __', '_ version __', '_engines', '_sparse', '_tseries', 'concat', 'core', 'crosstab', 'datetime' 
/ 'datetools', 'debug', 'ewma', 'ewmcorr', 'ewmcov', 'ewmstd', 'ewmvar', 'ewmvol', 'fama macbeth', 'groupby', "info'， 
'io', 'isnull', 'lib', 'load', 'merge', 'notnull', 'np', 'ols', 'pivot', 'pivot_table', 'read_clipboard', 'read_csv' 
'read_ table', 'reset_ printoptions', 'rolling apply', 'rolling corr', 'rolling corr_pairwise', 'rolling count', 'rollin 
g_cov', 'rolling_kurt', 'rolling max', 'rolling mean', 'rolling median', 'rolling_ min', 'rolling quantile', 'rolling_s 
kew', 'rolling_std', 'rolling_sum', 'rolling var', 'save', 'set_eng _ float format', 'set_printoptions', 'sparse', 'stat 
Ss', 'tools', 'util', 'value_range', 'version'] 


虽然 没有 类 似 read_csv0) 的 方法 ， 但 是 有 ExcelFile 类 ， 于 是 平 : 


>>> xls = pd.ExcelFile("./marks.xlsx") 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "/usr/lib/pymodules/python2.7/pandas/io/parsers.py", line 575, in _ init _ 
from openpyxl1 import load workbook 


我 这 里 少 了 一 个 模块 ， 看 报错 提示 ， 用 pip 安 装 openpyxl 模 块 : sudo pip 
install openpyxl。 继续: 


>>> xls = pd.ExcelFile("./marks.xlsx") 


>>> dir(xls) 


['_class_', '_ delattr__', '_dict ', '_doc ', '_ format ', '_ getattribute ', '_ hash_', '_init ', '_ modul 
e_', '_new ', '_reduce ', '_reduce ex ', '_repr_', '_ setattr_ ', '_ sizeof ', '_ str_', '__subclasshook _ 
， ' Wweakref__', '_parse xls', '_parse xlsx', 'book', 'parse', 'path', 'sheet_names', 'use_xlsx'] 


>>> xls.sheet_names 
['Sheet1', 'Sheet2', 'Sheet3'] 
>>> sheet1 = xls.parse("Sheet1") 
>>> sheet1 
0 于 2 3 4 
@ 5 - 199 196 25 2 
1 6 45 54 44 88 
-| 54 76 13 91 


3 全 54 452 26 100 


结果 中 ，columns 的 名 字 与 前 面 CSV 结 果 不 一 样 ， 数 据 部 分 是 同样 的 结 
果 。 从 结果 中 可 以 看 到 ，sheetl 也 是 一 个 DataFrame 对 象 。 
对 于 单个 的 DataFrame 对 象 ， 如 何 通过 属性 和 方法 进行 操作 ? 如 果 读 者 
理解 了 本 书 从 一 开始 就 吐 罕 进来 的 思想 利用 dir0 和 help0 或 者 到 官 
方 网 站 看 文档 一 一 此 时 就 能 比较 轻松 地 进行 各 种 控 作 了 。 


从 数据 库 中 查询 出 来 的 数据 ， 也 可 以 按照 Series 或 者 DataFrame 类 型 数 
据 进 行 组 织 ， 然 后 就 可 以 对 其 操作 。 


9.2.3 ”处 理 股票 数据 

某 段 时 间 某 国 股市 很 火爆 ， 不 少 专家 在 分 析 股 市 火爆 的 各 种 原因 ， 不 
久 ， 该 国 的 股票 又 开始 狂 跌 ， 各 种 各 样 的 救市 政策 仅仅 是 虹 臂 当 车 嗣 
了 。 不 过 ， 我 还 是 很 淡定 的 ， 因 为 没 钱 。 


但 是 ， 为 了 体现 本 人 也 是 与 时 俱 进 的 ， 束 以 股票 数据 为 例子 ， 来 简要 
说 明 Pandas 和 其 他 模块 在 处 理 数据 上 的 应 用 。 


1. 下 载 YAHOO 上 的 数据 
或 许 你 好 奇 ， 为 什么 要 下 载 YAHOO 上 的 股票 数据 呢 ? 国内 网 站 上 不 是 
也 有 吗 ? 有 ， 但 我 不 喜欢 用 。 我 喜欢 YAHOO， 因 为 它 曾 经 吸引 我 ， 注 


意 我 说 的 是 www.yahoo.com。 


YAHOO| 


虽然 YAHOO 的 号 影 渐 行 渐 远 ， 但 它 终究 是 值得 记忆 的 。 所 以 ， 我 要 演 
示 如 何 下 载 YAHOO 财 经 栏目 中 的 股票 数据 。 


In [1]: import pandas 


In [2]: import pandas .io.data 


In [3]: sym = "BABA" 


In [4]: finace = pandas.io.data.DataReader (sym, "yahoo", start="2014/11/11") 


In [5]: print finace.tail(3) 

Open High Low Close Volume Adj Close 
Date 
2015-06-17 86.580002 87.800003 86.480003 86.800003 10206100 86.800003 
2015-06-18 86.970001 87.589996 86.320000 86.750000 11652600 86.750000 


2015-06-19 86.510002 86.599998 85.169998 85.739998 10207100 85.739998 


下 载 了 阿里 巴巴 的 股票 数据 ( 自 2014 年 11 月 11 日 以 来 ) ， 并 且 打 印 最 


后 三 条 。 
2. 画 图 


已 经 得 到 了 一 个 DataFrame 对 象 ， 就 是 前 面 已 经 下 载 并 用 finace 变 量 引 
用 的 对 象 。 


In[6]: import matplotlib.pyplot as plt 


In [7]: plt.plot(finace.index, finace["Open"]) 


Out[]: [<matplotlib.lines.Line2D at 9xa88e5cc>] 


In [8]: plt.show() 


结果 如 图 9-4 所 示 。 
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图 9-4 阿里 巴巴 股票 数据 图 


从 图 9-4 中 可 以 看 出 阿里 巴巴 的 股票 目 从 2014 年 11 月 11 日 到 2015 年 6 月 
19 日 的 股票 开盘 价 的 变化 。 


上 面 指令 中 的 import matplotlib.pyplot as plt 是 此 前 没有 看 到 的 。 
matplotlib 模 块 是 Python 中 绘制 二 维 图 形 的 模块 ， 是 最 好 的 模块 。 可 异 
matplotlib 的 发 明 者 一 一 John Hunter 已 经 于 2012 年 8 月 28 日 因 病 医治 无 效 
英 年 早 逝 ， 这 真是 天 妒 英才 呀 。 为 了 缅怀 他 ， 请 读者 访问 官方 网 站 : 
matplotlib.org (http://matplotlib.org/) ， 并 认真 学 习 这 个 模块 的 使 用 。 


经 过 上 面 的 操作 ， 读 者 可 以 用 dir() 这 个 以 前 常用 的 法 宝来 查看 finace 所 
引用 的 DataFrame 对 象 的 方法 和 属性 等 。 只 要 运用 dirthelp 就 能 够 对 这 
个 对 象 进行 操作 ， 也 就 是 能 够 对 该 股票 数据 进行 各 种 操作 。 

再 次 声明 ， 本 书 仅仅 是 稍微 演示 一 下 相关 操作 ， 如 果 读 者 要 深入 研 

习 ， 共 请 寻找 相关 的 专业 书籍 资料 阅读 学 习 。 
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